В мире искусственного интеллекта и разработки больших языковых моделей весной 2025 года разгорелся крупный скандал, связанный с именем корпорации Huawei. По информации, предоставленной инсайдером из ведущей исследовательской группы Huawei Noah's Ark Lab, компания была вовлечена в практику клонирования и переименования чужих моделей искусственного интеллекта, в частности Qwen и DeepSeek, при этом выдавая их за собственные инновационные разработки. Эта ситуация вызвала волну обсуждений в IT-сообществе и поставила под сомнение честность одного из самых влиятельных игроков на рынке ИИ в Китае и мире. История скандала получила широкое распространение благодаря публикации в GitHub, а затем и детальным свидетельствам от сотрудника Huawei, который работал над проектом Pangu – собственным названием Huawei для серии своих моделей. По словам сотрудника, внутреннее сопоставление кода и характеристик выявило поразительное внешнее сходство между Pangu и Qwen 2.
5, а также клонов DeepSeek. Разоблачитель, имя которого указывает на глубокое знание внутренних процессов и структуры лаборатории, подробно описал организационную и техническую среду, в которой создавались эти модели. Лаборатория Noah's Ark Lab располагается внутри Huawei, под управлением директора с богатой карьерной историей, а сама команда исследователей разделена на подразделения с достаточно жесткой иерархией и распределением ответственности. Работа над Pangu вначале была представлена как исследовательская, однако, с течением времени превратилась в конвейер по доставке моделей для использования в различных продуктах Huawei, таких как Xiaoyi, облачные сервисы и решения для ICT. Интенсивный рабочий график, необходимость присутствия на сессиях и многочисленные проверки создавали напряженную и ограниченную инновационные процессы рабочую атмосферу.
По словам инсайдера, команда столкнулась с серьёзными техническими трудностями еще на ранних этапах развития Pangu. Проблемы касались слабой производительности используемого токенизатора, а также неэффективного использования оборудования Ascend NPU. Соперничество с китайскими компаниями-конкурентами, такими как Alibaba и Zhipu, указывало на отставание Huawei в области GPU-ускоренной тренировки моделей. Попытки создать крупные модели в 230 млрд параметров успеха не имели, что усугубляло дух команды. Главной точкой перелома стало вмешательство другой подкоманды внутри лаборатории, известной как Small Model Lab.
Именно она, по словам разоблачителя, реализовала шаг, который можно назвать открытым мошенничеством – клонирование модели Qwen версии 1.5 с 110 миллиардами параметров. Эта модель была переработана путем добавления нескольких вычислительных слоев и изменений в архитектуре, чтобы создать впечатление большого и качественного обновления, под названием 135B V2. Однако, технический анализ показал, что это был ничем не прикрытый кетчуп – плагин Qwen, переименованный и представлен как собственная разработка. Более того, исходный код и названия классов в модели содержали упоминания Qwen, что указывало на откровенную копию.
Это открытие вызвало серьёзные внутренние конфликты в Huawei, многие сотрудники были разочарованы и впоследствии покинули лабораторию. По словам инсайдера, даже старшие руководители компании, включая известных личностей, знали о ситуации, но предпочитали игнорировать факт плагиата, так как это приносило краткосрочные выгоды и позволило показать внешним заказчикам внушительные показатели. Помимо этого, в последующем было выявлено повторное клонирование – на этот раз модели DeepSeek v3. Small Model Lab практически полностью скопировал эту модель, значительно подкорректировав лишь минимальные параметры, чтобы избежать обнаружения плагиата. Официально этот продукт стартовал под названием Pangu Pro MoE 72B.
Инсайдер утверждает, что даже директория с контрольными точками решения не была переименована и оставалась «deepseekv3», что говорит о бесстыдном отсутствии оригинальности. Такие действия демонстрируют глубокие проблемы корпоративной культуры внутри Huawei, в том числе проявления бюрократии, где процессные нормы вызывают торможение в настоящем разработках модели с новым дизайном, но некоторые подразделения умудряются обходить контроль и создавать копии чужой интеллектуальной собственности без адекватных последствий. Несмотря на все эти обвинения и проблемы, основная команда Pangu проявила себя с технической стороны, создав модель Pangu V3, полностью разработанную с нуля. Эта модель, построенная с использованием LLaMA токенизатора и тренированная полностью на собственном оборудовании Ascend, достигла аналогичных по качеству результатов, которые признаны на рынке искусственного интеллекта. Процесс тренировки сопровождался постоянной борьбой с ошибками, сложностями и необходимостью выкручивать руки инженерной команде, чтобы достичь стабильности.
Однако, в результате внутренней политики и «передела авторства» соответствующие заслуги были неравномерно распределены и многие ключевые специалисты были исключены из авторских списков научных публикаций, что дополнительно демотивировало талантливых сотрудников. Разоблачения вызвали широкий резонанс не только в профессиональной сфере, но и среди широкой общественности, отражая глобальные проблемы китайской индустрии ИИ с точки зрения этики, корпоративного управления и защиты интеллектуальной собственности. Китаянские и международные эксперты отмечают, что подобные случаи наносят удар по репутации Huawei и доверия к национальному сектору разработки искусственного интеллекта. История стала важным уроком для организаций, работающих в области высокотехнологичных разработок, напомнив о необходимости прозрачности, честности и поощрения реального инновационного труда, а не заимствований и маскировки чужих достижений. Ситуация вокруг Huawei и скандала с клонированием моделей Qwen и DeepSeek продолжает развиваться.