Процесс научно-исследовательской разработки больших языковых моделей остаётся одним из самых сложных и ресурсозатратных направлений в сфере искусственного интеллекта. Особенно это касается отечественных гигантов, пытающихся конкурировать с мировыми лидерами на фоне ограничений инфраструктуры, кадров и постоянного давления со стороны конкурентов и управления. История создания крупной языковой модели Pangu (盘古), разработанной лабораторией Ноя Huawei Noah, служит одной из ярчайших иллюстраций трудностей, с которыми сталкивается современная высокотехнологичная компания, пытаясь удержать позиции на переднем крае инноваций. Эта история наполнена не только научными достижениями, но и драматическими внутренними конфликтами, разочарованиями и даже обвинениями в манипуляциях и мошенничестве, затребовавшими от сотрудников огромной моральной стойкости и самопожертвования. Изначально проект Pangu стартовал с большими надеждами и амбициозными планами.
Команда пыталась разработать высококачественную языковую модель, способную конкурировать с зарубежными аналогами. Однако по мере погружения в задачи появился ряд серьезных вызовов. Основными трудностями стали ограниченность вычислительных ресурсов, недостаточная зрелость инфраструктуры и технические ошибки, связанные с выбором архитектуры и параметров модели. Кроме того, корпоративная культура Huawei, с её дисциплинированным, но жёстким подходом к управлению проектами, оказалась причиной не только высокой нагрузки на сотрудников, но и появления систематической бюрократической волокиты, что серьёзно тормозило гибкость и скорость принятия технических решений. На начальных этапах команда работала с оборудованием Ascend, внутренним продуктом Huawei, преодолевая множество проблем, связанных с недостаточной стабильностью и ограниченным функционалом.
Особенно остро ощущался недостаток современных технологий обработки данных, таких как эффективные токенизаторы, которые играют ключевую роль в успешном обучении языковых моделей. Внутренние исследования выявили значительные дефекты в алгоритмах токенизации, которые приводили к перерасходу ресурсов и ухудшению качества модели. Параллельно с этим ситуация усугублялась резким отрывом в технологии по сравнению с конкурентами из других компаний, в том числе Alibaba и Zhipu, где обучение моделей базировалось на мощных GPU и более совершенных методах. Этот разрыв зачастую становился предметом внутренней критики и подрывал моральный дух команды. В сложившихся условиях некоторые подразделения Huawei решили пойти по пути не совсем «чистых» практик, включая использование чужих моделей с незначительными модификациями, выдавая их за собственные разработки.
Одним из таких случаев стал так называемый 135-миллиардный параметрический вариант модели, где в реальности происходила дообучение чужой модели (Qwen 1.5 110B) со вставками и доработками, создавая иллюзию собственной инновации. Эта практика была хорошо известна внутри компании и даже среди некоторых партнёров, однако высшее руководство, по всей видимости, закрывало на это глаза, предпочитая результаты, пусть и сомнительные с этической точки зрения, вместо длительных и рискованных исследований с настоящим новаторским подходом. Такое положение вещей вызывало внутренний конфликт между командами, что сказывалось на продуктивности и атмосфере работы. Множество талантливых специалистов постепенно покидали проект, устав от невозможности полноценно реализовать свой потенциал и наблюдая, как их труд используется в не совсем честных целях.
В итоге Pangu смог добиться успехов лишь на третьем витке разработки — третьем поколении модели, когда была уже достигнута более высокая степень самостоятельности в создании архитектуры и организации процессов обучения с нуля. Этот этап стал своего рода торжеством технических усилий верных делу специалистов, которые боролись за подлинность и качество продукта, несмотря на прежние неудачи и внутренние препятствия. Ключевым элементом успеха стало улучшение токенизатора, адаптация современных алгоритмов позиционного кодирования и оптимизация параметров, что позволило поднять качество и стабильность обучения. В то же время давление и вмешательство команды малого масштабирования, которая отвечала за интеграцию и поставку конечных продуктов, продолжали создавать стрессовые условия для основной исследовательской группы. Эта часть коллектива получила в СМИ прозвище «лаборатории кликателей мышей» — ироничное обозначение тех, кто использовал готовые или чужие модели, представляя их как собственные, и подстраивал технические отчёты под требования заказчиков, не неся при этом прямой ответственности за качество.
Отношения между подразделениями Huiwei Noah Noah Ark Lab и малыми исследовательскими группами осложнялись не только разным подходом к работе, но и тем, что одна сторона имела больше политического влияния на уровне руководства. Это создавало вскрытые конфликты, приводившие к тому, что результаты серьезной работы подчас были поглощены менее заслуженными успехами «объединённого» бренда Pangu. Кроме того, корпоративная жёсткая система процессов управления, включая многочисленные совещания, отчётность и контроль, затрудняла инновации, замедляла внедрение новых идей и порой даже подрывала инициативу. История Pangu также свидетельствует о важности правильного управления талантами и создания мотивирующей среды. Несмотря на наличие профессионалов высочайшего уровня, чувство выгорания, несправедливой оценки труда и внутреннее противостояние вынуждали многих уходить в более комфортные условия или к конкурентам.
Утечка кадров негативно сказывалась не только на ходе проектов, но и на имидже Huawei как работодателя в области высоких технологий. Аналитики и эксперты AI-комьюнити подчеркивают, что ключевая проблема Huawei — это не только технические аспекты, но и необходимость трансформации корпоративной культуры, системы поощрений и взаимоотношений внутри компании. Без уважения к научной этике и без открытости к новому командному духу невозможно достичь устойчивого технологического лидерства. Инциденты с сомнительными методами обучения и обманом создают не только внутренний раскол, но и наносят ущерб репутации на мировом уровне, где прозрачность и честность являются одним из главных критериев доверия. Несмотря на все сложности и ошибки, сотрудники, оставшиеся в проекте, продолжают бороться за развитие отечественных технологий.
Их самоотверженность и стремление к совершенству позволяют надеяться, что технологии Pangu и премиальная вычислительная платформа Ascend смогут в будущем стать реальным конкурентом западным решениям. Чтобы достичь этого, компании предстоит решить сложные вопросы структурного управления и добиться культурной реформы, признания заслуг всех участников и создания здоровой, динамичной инновационной среды. История Pangu — это не только рассказ о технологических достижениях, но и важный урок для всего индустриального сообщества Китая о том, как внутренние проблемы и отсутствие честности могут ставить под угрозу амбициозные проекты и мешать развитию передовых научных исследований. В конечном счёте, успех инноваций зависит не только от алгоритмов и кодов, но и от людей, их честности, доверия и единства. Возвращаясь к корням, Huawei и её команда Noah могут возродить проект Pangu, опираясь не только на мощь вычислений, но и на принципы открытости, поддержки талантов и готовности к переменам.
Это позволит сделать Pangu по-настоящему мировой и достойной платформой в глобальной гонке искусственного интеллекта.