В последние годы Китай активно инвестирует в развитие технологий искусственного интеллекта, стремясь конкурировать с западными гигантами и создавать собственные технологические экосистемы. Одним из ключевых игроков в этой сфере является Huawei с ее серией больших языковых моделей под названием Pangu. Однако недавно в профессиональных кругах и СМИ появился громкий скандал, связанный с обвинениями в плагиате и неэтичном использовании чужих технологических наработок внутри проекта Pangu. Информация поступила от бывшего сотрудника Huawei, который на условиях анонимности рассказал подробности о разработке Pangu и сообщил о подозрениях, что несколько версий модели являются результатом переобучения (финетюнинга) и модификации чужих популярных моделей Qwen и DeepSeek. Согласно заявлениям источника, который работал внутри Noah's Ark Lab — одного из исследовательских подразделений Huawei, ответственного за разработку языка моделей — ситуация с Pangu складывалась крайне сложно.
Внутри компании существовали группы разработчиков, которые столкнулись с серьезными проблемами, начиная с ограниченного оборудования и не оптимальных алгоритмов для обучения моделей. Более того, часть сотрудников подозревала, что «модель» Pangu, которая преподносилась как оригинальный и результат долгих усилий, во многом базировалась на технологиях и параметрах моделей, которые были разработаны внешними компаниями, в частности, Qwen от Alibaba и DeepSeek, а также на методах их дообучения без указания авторства. Позиция информатора проливает свет на внутреннюю борьбу между разными командами в Huawei: одна из них была ориентирована на полноценное самостоятельное обучение ИИ-моделей с нуля, используя платформу Ascend (昇腾) — фирменные чипы Huawei, другая же команда, называемая малой лабораторией моделей (小模型实验室), стремилась максимально быстро продвигать коммерческие решения, причем с высоким уровнем зависимости от ранее существующих технологий, особенно Qwen и DeepSeek. Это привело к неоднозначной ситуации, в которой разработка Pangu стала восприниматься многими как продукт компромисса и частичного «заимствования», что подорвало доверие среди инженеров и экспертов. Обвинения в плагиате основываются на техническом анализе параметров и архитектуры моделей.
Например, версия Pangu 135B V2, которая была выведена на рынок как полностью созданная внутри Huawei, ее код и метаданные по крайней мере частично соответствовали Qwen 1.5 110B — версии крупной модели от Alibaba. При этом глубина сети, количество слоев и конфигурация отличались, но ключевые веса параметров оставались практически идентичными. Внутренние сотрудники рассказывали, что названия классов даже не переименовывались, что свидетельствует о менее деликатном подходе по отношению к интеллектуальной собственности. Кроме того, выяснилось, что при дообучении и модификации моделей использовалась неящаяся загрузка чекпоинтов и параметров других моделей без соответствующих согласований и признания.
Это касалось и 72B Moe-модели от малой лаборатории, которая позиционировалась как самостоятельная разработка, но на деле была сконструирована через продолжение обучения и расширение существующих моделей DeepSeek и Qwen, причем без полного раскрытия источников. Дополнительные данные указывают на умышленные попытки замаскировать имена, а также введение размытых данных для «стирания» следов оригинального кода. Внутренние процессы в Huawei, по словам инсайдера, были чрезмерно бюрократичеными и препятствовали быстрому и качественному развитию моделей с нуля. Строгое (и зачастую слишком формальное) управление версиями, контроль происхождения моделей и сложные процедуры подтверждения мешали развитию инноваций. При этом малая лаборатория свободно распоряжалась ресурсами и обходила эти ограничения, что создавало ситуацию, когда одни команды испытывали давление качества и сроков, а другие работали в полуавтономном режиме с меньшими требованиями.
Эта внутренняя дисгармония в итоге привела к массовому исходу талантливых сотрудников, которые разочаровались в условиях работы и моральных установках внутри компании. Некоторые покинули Huawei и продолжили карьеру в уважаемых командах в ByteDance, DeepSeek, Tencent и других крупных технологических компаниях. И эта утечка кадров оказала влияние на позицию Huawei на международном рынке ИИ, ослабив потенциал компании в стратегическом сегменте разработки больших языковых моделей. Однако есть и позитивный момент — версия модели Pangu 135B V3 стала результатом реальной разработки команды, которая с нуля обучала модель на платформе Ascend с собственной архитектурой и улучшенными токенизаторами. Этот этап по мнению многих экспертов был крайне сложным и требовал большой самоотдачи, но он позволил Huawei доказать возможность создания конкурентоспособного ИИ-инструмента без плагиата.
Несмотря на то, что результаты этой версии ближе к рынку и более прозрачны, популярность и репутация проекта Pangu сильно пострадали из-за предыдущих обвинений. Ещё одной важной деталью является то, что в технических отчетах и официальной документации Huawei в значительной степени не отражалась взаимосвязь моделей и подробно не обозначались внешние источники. Работники делились впечатлениями, что в документах и презентациях присутствовали люди, которые подпиcывались на отчёты, но фактически не участвовали в разработке, а реальные авторы оказывались незамеченными. Это не только снижало моральный дух, но и подрывало доверие к научной культуре внутри компании. Информатор, решившийся на разоблачение, сделал это на фоне опасений за свою карьеру и безопасность, признавая, что политика внутри Huawei и масштаб её влияния делают борьбу с нарушениями прав и честностью крайне сложной.
Публикация этих сведений стала вызовом для крупной китайской корпорации и подняла в общественном и экспертном сообществе вопросы прозрачности и этики в быстро развивающейся сфере искусственного интеллекта. Реакция Huawei на обвинения пока минимальна, и компания не опубликовала официального детального ответа, ограничившись общими утверждениями о приверженности инновациям и усовершенствованию своих продуктов. Тем не менее, этот кейс оказался уроком для индустрии ИИ в Китае, показывая, насколько важно строить доверие не только к достижениям, но и к методам их получения. Кроме внутренних последствий для Huawei, данный инцидент важен и на фоне глобального соперничества в области искусственного интеллекта между Китаем и США. Во многих странах вопросы интеллектуальной собственности, этики и ответственного использования технологий становятся ключевыми темами для регуляторов, исследователей и бизнеса.
Пример с Pangu показывает, что подобные проблемы могут возникать и внутри крупнейших технологических корпораций, что подчеркивает необходимость развития открытых и прозрачных процессов разработки. В целом, скандал вокруг плагиата в проекте Pangu определенно повлиял на восприятие китайских моделей ИИ на мировом уровне. Он стал сигналом внутреннего кризиса, свидетельствующим о слабых местах в управлении проектами, а также о сложностях перехода от наследия и адаптации технологий к эпохе самостоятельных инноваций. Тем не менее, некоторые достижения, особенно результаты разработки 135B V3, показывают, что Huawei и китайская индустрия в целом способны преодолеть эти трудности. Будущее Pangu и, шире, китайских больших языковых моделей во многом зависит от способности индустрии внедрять лучшие практики, открыто говорить о проблемах и создавать культурную среду, которая ценит честность и качество, а не быстрые и сомнительные победы.
В условиях стремительного развития искусственного интеллекта именно такие ценности окажутся решающими для долгосрочного успеха и доверия пользователей. Возникает вопрос, как подобные ситуации повлияют на репутацию Huawei на глобальном технологическом рынке и смогут ли китайские законодатели и бизнес сообща выстроить экосистему, где достоинство и инновации идут рука об руку. Пока же история с Pangu остается одним из самых ярких примеров серьезных вызовов, с которыми сталкиваются ведущие компании в эпоху ИИ, и уроком того, как важно не терять этику и профессионализм даже под давлением рынка и конкуренции.