В последние годы искусственный интеллект стал одной из ведущих областей технологического прогресса, и китайская компания Huawei предприняла амбициозную попытку занять в ней значимое место. Их флагманская языковая модель Pangu должна была стать ответом на западные разработки, конкурируя с такими гигантами, как GPT-3. Однако недавние разоблачения показали, что путь к созданию этой звёздной модели был далеко не идеален, проникнут напряжёнными внутренними конфликтами, выгоранием сотрудников и обвинениями в плагиате. История раскрытая на платформе GitHub в виде отчёта с названием True-Story-of-Pangu предоставляет откровенный взгляд изнутри на процесс разработки модели Pangu. Автор документа — один из бывших участников ключевой команды, который описал, как проект, позиционировавшийся как долгосрочное исследование, превратился в гонку сжатых сроков и жесточайшей конкуренции внутри компании.
Одна из центральных проблем, с которыми столкнулась команда, это невозможность использовать популярные и надёжные графические процессоры NVIDIA из-за санкций США. В результате разработчикам пришлось полагаться на китайские чипы Ascend, разработанные самой Huawei. Эти чипы оказались нестабильными, что привело к значительным задержкам и огромным усилиям для стабилизации инфраструктуры. Многие сотрудники испытывали моральное и физическое выгорание, так как технология требовала постоянного преодоления технических препятствий на всех этапах обучения моделей. Несмотря на трудности, команда создала несколько итераций моделей с параметрами от 13 до 135 миллиардов, включая сложные архитектуры с механизмами Mixture of Experts.
Было много экспериментов и попыток оптимизировать использование токенизаторов и архитектур, однако серьёзные сбои в процессе даже заставляли прекращать тренировки на самых масштабных вариантах, в том числе на модели с 230 миллиардами параметров. Тем не менее, в компании появился малый внутренний соперник — другая команда, которая заявила о своих успехах на основе более компактных моделей. Они утверждали, что за счёт инновационных методов и уникальных идей смогли существенно улучшить показатели на больших моделях, предоставляя результаты с внушительными приростами метрик. Однако вскоре выяснилось, что успехи малого коллектива не были полностью честными. Согласно данным из внутреннего отчёта, инновации малой команды во многом были основаны на копировании и переработке моделей Alibaba Qwen.
Они изменяли параметры моделей конкурента, вставляли элементы из собственных исследований, меняли архитектуру и поверхностно маскировали заимствования, что создавало иллюзию оригинальной разработки. Это породило серьёзный конфликт, поскольку основная команда, которая выполняла всю работу честно и методично, оставалась в тени, видя как чужие достижения присваиваются без должного признания. Ситуация усугублялась управленческими решениями. Руководство знало о фактах плагиата и нарушений, но закрывало глаза на эти факты, так как поддельные достижения помогали поддерживать положительный имидж компании и привлекать государственную поддержку. Такой подход привёл к вынужденному уходу многих талантливых специалистов, которые предпочли искать работу в более честных и открытых организациях, где ценятся настоящие разработки и инновации.
Этот скандал не ограничивается Huawei или просто внутренними корпоративными проблемами. Он отражает более широкие вызовы, с которыми сталкивается современная индустрия искусственного интеллекта. Экспоненциальный рост требований к скорости разработки, геополитическое давление и жёсткая конкуренция создают условия, в которых граница между вдохновением, заимствованием и воровством становится всё более размытым. Законы и этические нормы пока что не успевают адаптироваться к новым реалиям, в которых миллиарды параметров моделей могут быть практически «переписаны» с уже существующих решений. Однако среди всего негатива, связанного с этим инцидентом, есть и позитивные моменты для всей технологии в целом.
Появились инструменты и методы, позволяющие проводить анализы моделей с целью выявления плагиата и заимствований. Компании, исследовательские группы и активисты начинают использовать спектры параметров, архитектурные детали и другие «отпечатки» моделей для доказательства их происхождения. Это похоже на криминалистику для нейросетей, что открывает путь к более прозрачной системе признания авторства и борьбы с недобросовестными практиками. Кроме того, история Pangu демонстрирует важность open-source проектов и открытости в разработке ИИ. Несмотря на попытки некоторых игроков переработать или замаскировать чужие модели, открытые разработки продолжают показывать свою устойчивость и способность быстро привлекать таланты и общественную поддержку.
Это укрепляет веру в то, что в борьбе инноваций и клонирования победит именно честный и открытый подход. История Huawei и Pangu — это урок для всей индустрии и призыв к пересмотру принципов разработки ИИ. Необходимы новые правила игры, которые защитят интеллектуальную собственность, обеспечат справедливое распределение заслуг и повысят уровень ответственности всех участников рынка. Без них высокотехнологичные компании рискуют пожертвовать не только профессиональной репутацией, но и самим будущим искусственного интеллекта, который должен служить человечеству, а не стать ареной корпоративных интриг и нечестных практик. В конечном счёте, конфликт вокруг Pangu заставляет задуматься над тем, каким путём пойдёт индустрия ИИ в ближайшие годы.
Смогут ли разработчики найти баланс между скоростью, качеством и этикой, или гонка за лидирующими позициями вновь поставит на первое место только результат любой ценой? Ответ на этот вопрос зависит от сознательных усилий специалистов, руководителей и регуляторов, которые должны совместно формировать будущее технологий во благо общества. Развернутые обсуждения, новые открытия в области проверки честности моделей и рост влияния открытых разработок создают оптимистичные предпосылки для исправления текущих проблем и построения более прозрачной, конкурентоспособной и справедливой экосистемы искусственного интеллекта. Huawei, будучи одним из ключевых игроков этой отрасли, теперь стоит перед вызовом переосмысления собственных методов и стандартов, чтобы не повторять допущенных ошибок и вернуть доверие как внутри компании, так и на международном уровне.