В современном производстве проволочных прутков скорость и качество выпускаемой продукции зависят не только от технического оснащения, но и от способности своевременно выявлять аварийные ситуации, такие как появление летающей стали. Этот феномен представляет собой случай, когда части проволоки при производстве неожиданно выходят из-под контроля из-за разрыва или других дефектов, что нередко приводит к авариям, повреждению оборудования и угрозам безопасности персонала. Традиционные методы обнаружения подобных инцидентов, основанные на аппаратных датчиках и ручном контроле, чаще всего демонстрируют низкую оперативность и сложность в настройке, что снижает общую эффективность производства. В таких условиях применение современных алгоритмов компьютерного зрения становится оптимальным решением для повышения точности и скорости выявления подобных происшествий. YOLO (You Only Look Once) — это серия алгоритмов для определения объектов в изображениях и видео, которые известны своей высокой скоростью обработки и точностью распознавания.
В 2023 году появилась восемь версия — YOLOv8, обладающая рядом значительных улучшений относительно предшественников, что делает её особенно перспективной для применения в промышленности. Однако для задачи обнаружения летающей стали, учитывая её уникальную, случайную форму и быстрое движение, классическая версия YOLOv8 нуждается в доработках для повышения точности и снижения времени отклика. Одним из ключевых нововведений, реализованных в улучшенной модели YOLOv8, является использование Omni-dimensional Dynamic Convolution (ODConv). Этот метод обеспечивает динамическую адаптацию сверточных ядер во всех измерениях: пространственном, по входным и выходным каналам, что позволяет модели лучше захватывать релевантные признаки летающей стали независимо от её вариаций в форме и размере. Внедрение ODConv в начальный этап обработки входного изображения усиливает способность нейросети извлекать более информативные и релевантные характеристики из производственного видео в реальном времени.
Помимо этого, улучшение конструкции нейросети включает создание облегченного модуля под названием C2f-PCCA_RVB. Он заменяет исходный модуль C2f в так называемой «шее» сети — части архитектуры, отвечающей за агрегацию и обработку признаков разных уровней и масштабов. Использование этого модуля существенно снижает вычислительные ресурсы, необходимые для обработки, что напрямую влияет на скорость детекции без значительной потери в точности. Ключевая особенность C2f-PCCA_RVB заключается в интеграции Partial Convolution (PConv) и Coordinate Attention (CA), которые улучшают способность сети к фокусировке на локальных и координатных особенностях изображения. Такая конструкция снижает избыточность и одновременно повышает качество распознавания сложных, частично скрытых объектов, характерных для анализа видеопотока из производственных линий.
Еще одним важным интеллектуальным дополнением является Efficient Multi-Scale Attention (EMA) — механизм внимания, который эффективно объединяет контекстную информацию с разных масштабов изображения. Введение модуля EMA в область шеи сети способствует лучшему учету глобальных взаимосвязей между признаками, что особенно полезно при работе со сложными сценами, содержащими артефакты, шумы и искажения, часто встречающиеся в производственных условиях. Данная интеграция обеспечивает более точное выделение летающей стали как объекта, улучшая качественные показатели обработки и снижая количество ложных срабатываний. Для создания качественной обучающей выборки исследователи применили комбинированный подход сбора данных из двух основных источников. Первый — это регулярный отбор кадров из видеозаписей с производственного объекта, который обеспечивает реальную иллюстрацию рабочих процессов и инцидентов.
Второй — сбор изображений и видеоматериалов с открытых ресурсов Интернета, что расширяет разнообразие ситуаций и способствует построению более универсальной модели. Такой метод сбора данных помогает обеспечить баланс между редкими аварийными событиями и обычными режимами работы, что критично для обучения модели на адекватном представлении обеих категорий. Кроме того, в процессе подготовки данных реализован комплекс методов аугментации, включающий случайные повороты, смещения и растяжения изображений. Эти трансформации позволяют модели быть более устойчивой к вариациям в ракурсе и форме объектов, а также способствуют предотвращению переобучения. Модель обучалась с фиксированным разрешением входного изображения 640 на 640 пикселей, что обеспечивает оптимальный компромисс между качеством распознавания и производительностью вычислений.
Для оценки эффективности была выбрана модификация YOLOv8n — самая компактная и быстрая версия оригинального алгоритма. Разработка и внедрение улучшенного алгоритма позволили достичь впечатляющих результатов: средняя точность (mAP@0.5) при детекции достигла 99.1%, а время обработки одного кадра сократилось до 2.5 миллисекунд.
Эта производительность открывает возможность его интеграции в систему мониторинга производства с высокой скоростью потока данных, поддерживая высокоточное и надежное обнаружение летающей стали в реальном времени. В сравнительных экспериментах улучшенная модель демонстрирует преимущество не только перед предыдущими версиями YOLO, но и в целом среди популярных алгоритмов объектного обнаружения. Несмотря на более высокую точность, модель отличается небольшой вычислительной нагрузкой и минимальным временем задержки, что особенно важно для промышленного применения. Помимо чисто технических аспектов, данное исследование поднимает важную проблему — необходимость дальнейшего расширения и обогащения датасета для повышения общей надежности и универсальности модели. Учитывая сложность и уникальность ситуации с летающей сталью, а также ограниченность существующих данных, будущее направление связано с активным сбором и маркировкой новых образцов, а также с исследованием методов саморегуляции и обучения без учителя, способных работать в условиях дефицита аномальных примеров.
В целом, применение машинного зрения и глубокого обучения в промышленной безопасности, входящее в контур цифровизации производственных процессов, становится ключевым фактором повышения эффективности и сохранения здоровья сотрудников. Разработанная система на базе улучшенного YOLOv8 не только ускоряет реагирование на опасные ситуации, но и снижает риск остановок производства и финансовых потерь. С практической точки зрения такие технологии способствуют становлению «умных» производств, где данные и алгоритмы совместно обеспечивают устойчивость и безопасность операций. Несмотря на исключительную успешность модели в лабораторных условиях, ее практическое применение требует дальнейшей проверки и адаптации в реальных промышленных условиях, где вариативность окружающей среды и оборудования могут внести новые вызовы. Тем не менее, приведенные результаты уже сейчас создают основу для разработки надежных систем автоматического мониторинга, способных кардинально изменить подход к безопасности на предприятиях металлургической отрасли.
Таким образом, интеграция современных технологий глубокого обучения и продвинутых методов обработки изображений в процесс обнаружения летающей стали является значительным шагом вперед в обеспечении промышленной безопасности и повышения операционной эффективности. Усовершенствованная модель YOLOv8 с ODConv, облегченной архитектурой C2f-PCCA_RVB и комплексным вниманием EMA представляет собой оптимальное сочетание точности, скорости и адаптивности, необходимое в условиях высокоскоростного производства проволочных прутков. Продолжающийся прогресс в этой области обещает еще более интеллектуальные и надежные инструменты, способные помочь промышленности своевременно выявлять опасные события и минимизировать риски для оборудования и персонала.