Баскетбол — стремительный и динамичный спорт, в котором правила постоянно требуют строгого соблюдения. Одним из таких правил является так называемое правило 3 секунд, которое направлено на то, чтобы игроки не задерживались слишком долго в краске — области около корзины, известной также как «краска» или «ключ». Нарушение этого правила часто вызывает споры среди болельщиков, ведь сложно уследить за временем нахождения каждого игрока в зоне, особенно когда ситуация развивается стремительно. В таких условиях на помощь приходит искусственный интеллект и современные технологии компьютерного зрения, способные автоматически фиксировать подобные нарушения в режиме реального времени, делая игру более честной и прозрачной. Современные алгоритмы открывают дверь к созданию надежной системы, которая благодаря видеоаналитике отслеживает положение игроков, определяет нахождение их тела в краске и подсчитывает время пребывания, выявляя нарушения с максимальной точностью.
Правила 3 секунд в баскетболе существуют в двух вариациях. Отрывок из NBA устанавливает, что атакующий игрок не может оставаться в краске дольше трех секунд подряд, пока его команда контролирует мяч. В то же время защитник тоже ограничен во времени нахождения в краске, если он не защищает активно соперника. Для автоматизации выявления нарушения достаточно сфокусироваться на главном аспекте — определении факта нахождения игрока в зоне и времени, проведенном там. Главная задача при создании такой системы заключается в точном и надежном отслеживании каждого игрока на площадке.
Для этого был выбран метод отслеживания объектов с использованием модели Segment Anything Model (SAM) 2 от компании Meta, которая обеспечивает высококачественное отслеживание, начиная с первого кадра и без необходимости обучать индивидуальные признаки для каждого игрока. Начальным этапом становится автоматическое обнаружение игроков с помощью специально обученного детектора объектов YOLOv11, который определяет границы игроков в первом кадре, после чего SAM2 продолжает их слежение на протяжении всего видео. Отдельной проблемой была неверная генерация масок, которые могли содержать части мяча или фон, ошибочно относимые к игроку. Для решения создали функцию remove_noisy_segments, которая эффективно очищает маски от лишних сегментов на основе размеров и расстояния относительно центра игрока, гарантируя более точное выделение тела спортсменов. Вторым важным этапом стало распознавание ключевых точек на баскетбольной площадке, таких как границы краски и линии трехочковой зоны.
Для этого была использована техника определения ключевых точек с помощью обученной модели на YOLOv11, позволяющей точно локализовать контуры зоны в каждом кадре. Полученные ключевые точки соотносятся с эталонным планом площадки с помощью гомографии, что дает возможность проектировать игроков на координатную систему корпуса и вести подсчет времени нахождения в краске. В случае неполного обнаружения точек используемые алгоритмы с помощью геометрических реконструкций компенсируют пропущенные данные, создавая полный контур зоны. Следующим шагом становится определение, находится ли игрок непосредственно в краске. Традиционные методы основывались на анализе масок или координат нижней части ограничивающего прямоугольника, однако они оказались недостаточно точными, особенно в ситуациях, когда одна нога была внутри зоны, а другая — снаружи.
Для повышения точности была внедрена модель оценки позы на базе YOLOv11, которая выявляет различные ключевые точки тела, включая лодыжки, колени и другие суставы. Это дает возможность точно определить положение ног игроков и понять, когда именно они входят или выходят из зоны. Если в кадре не удалось распознать ключевые точки позы, используется запасной способ с анализом середины нижней части ограничивающей рамки игрока, что все еще позволяет принимать оптимальные решения по нахождению игрока в краске. На основании полученных данных программа с помощью компонентов из библиотеки Supervision, таких как PolygonZone, вычисляет, находится ли игрок внутри зоны, анализируя координаты лодыжек и соотнося их с контуром краски. Для подсчета времени, проведенного игроком в краске, применяется класс FPSBasedTimer, который учитывает частоту кадров видео и надежно переводит количество кадров в секунды, давая четкое представление о времени пребывания в зоне.
Если счетчик превышает три секунды, система автоматически сигнализирует о нарушении. Полный рабочий процесс начинается с подачи видеоданных, на которых сначала выполняется обнаружение игроков, затем их отслеживание по кадрам при помощи SAM2 с фильтрацией масок. Далее модель ключевых точек фиксирует линии площадки, позволяя реконструировать краску для определения зоны. Параллельно происходит оценка позы игроков с выделением ключевых точек, где камертон ложится на лодыжки. По совокупности этих данных происходит оповещение о нарушениях правила 3 секунд при необходимости, сопровождающееся визуальными эффектами и цветовой индикацией.
Результаты демонстрируют высокий уровень точности и устойчивость к разным условиям съемки и перспективе, делая систему пригодной для внедрения как в аналитические платформы, так и в технологии видеопросмотра матчей и трансляций. Конечно, текущее решение пока не учитывает отличия между атакующими и защитниками, а также не определяет активность в защите, но именно эта основа дает простор для дальнейших исследований и развития, включая классификацию команд и интеграцию сложных моделей поведения. Развитие технологии искусственного интеллекта и глубокого обучения дает новые перспективы для спортивной аналитики и автоматизации судейства. Такие достижения значительно облегчают нагрузку на рефери, уменьшают количество ошибок и обеспечивают зрителям и экспертам более глубокое понимание игры в режиме реального времени. В перспективе можно ожидать появление более комплексных систем, которые интегрируют огромное количество данных, включая позиционные, тактические и биометрические, позволяя делать баскетбол еще более конкурентным и увлекательным видом спорта.
Технологии автоматического определения нарушений правил с помощью искусственного интеллекта — это неотъемлемая часть будущего спортивных состязаний, благодаря которым игра становится справедливее, а аналитика — точнее и информативнее.