В современном мире видеоконференции стали неотъемлемой частью повседневной жизни, будь то удалённая работа, обучение или проведение международных встреч. Качество видео играет ключевую роль в эффективности коммуникации, а проблемы с пропускной способностью и качеством изображения остаются серьёзными вызовами. Именно в этой области инновационные достижения компании Collabora подтвердили своё лидерство, завоевав первое место в одном из самых престижных соревнований ICME 2025 Grand Challenge на тему видео супер-разрешения для видеоконференций. ICME, или Международная конференция по мультимедиа и экспо, является одной из крупнейших мировых площадок для обмена передовыми достижениями в области мультимедийных технологий. В 2025 году Collabora представила уникальное решение в конкурсе Track 3, посвящённом развитию технологий улучшения качества видео с низкой пропускной способностью, что вызвало широкий резонанс в сообществе учёных и разработчиков.
Команда машинного обучения Collabora, возглавляемая такими экспертами, как Маркус Эдель, Винеет Сурьян и Аарон Боксер, представила инновационный метод «смеси экспертов» (mixture-of-experts) для супер-разрешения видео, специально адаптированный для экранного контента. Этот подход позволяет значительно повысить чёткость и детализацию изображения в условиях ограниченной полосы пропускания, что особенно важно для сценариев экранного совместного использования, когда текст и графика должны оставаться максимально разборчивыми. Основой их технологии является объединение нескольких мощных моделей. Во-первых, используется Интегрированная Трансформерная Сеть для Видео Супер-Разрешения (Implicit Transformer Super-Resolution Network, ITSRN), отвечающая за восстановление общей структуры изображения и повышение его качества. Во-вторых, в интегрированном процессе применяется текст-специфичная доработка, основанная на диффузионной модели, вдохновлённой технологиями TextSSR.
Эта часть фокусируется на улучшении текстовых элементов за счёт поддержки с помощью больших языковых моделей, которые автоматически исправляют ошибки OCR (оптического распознавания символов), повышая читаемость даже при сильных искажениях исходного видео. Именно такое сочетание техники позволяет Collabora добиться высококачественного апскейлинга экранного контента при минимальном расходе пропускной способности сети. Это особенно актуально в текущих условиях, когда во многих странах и компаниях продолжают использоваться ограниченные интернет-соединения, а требования к качеству видеосвязи постоянно растут. Победа на ICME 2025 Grand Challenge стала важным подтверждением преуспевания Collabora в области открытых технологий и искусственного интеллекта. Ранее команда компании уже получила признание — их проект WhisperFusion был номинирован на Embedded Award 2024 на конференции Embedded World, что свидетельствует о продолжительном успехе и стабильном развитии исследований.
Кроме технического прорыва, Collabora активно делится накопленными знаниями с профессиональным сообществом. В рамках ICME 2025, который проходил в конце июня в Нанте, Франция, Маркус Эдель представил доклад, в котором подробно рассказал о принципах работы их новой гибридной модели и показал, как сочетание ITSRN и диффузионного текстового уточнения даёт результат мирового класса. Этот обмен опытом способствует ускоренному развитию технологий и вдохновляет других исследователей применять подобные подходы в своих проектах. Collabora также предлагает обширное сотрудничество всем заинтересованным в развитии проактивных и доступных решений на базе открытого исходного кода и Linux для проектов машинного обучения. Благодаря укреплению партнерских связей, компания помогает разрабатывать новые инструменты, которые могут быть адаптированы под самые разные задачи, от видеосвязи до видеоаналитики и сжатия.
Победа на ICME стала знаковым событием, которое демонстрирует рост компетенций Collabora и усиливает её репутацию как передового центра исследований и разработок в области мультимедиа. Их работа помогает не только улучшить пользовательский опыт в приложениях для видеоконференций, но и открывает новые горизонты для создания интеллектуальных мультимедийных систем в будущем. Современные тренды показывают, что качество видеоконтента, оптимизация использования ресурсов и внедрение искусственного интеллекта — ключевые направления развития коммуникационных технологий. Collabora с их инновационной технологией супер-разрешения становится пионером в этой области, задавая новые стандарты и раскрывая потенциал открытого программного обеспечения и машинного обучения. В мире, где видеосвязь становится всё более глобальной и жизненно важной, решения, способные делать изображение чётким и информативным даже при низкой скорости интернета, будут пользоваться всё большим спросом.