В последние годы мир искусственного интеллекта переживает стремительную трансформацию, и одним из наиболее заметных процессов стало перераспределение влияния между ведущими странами и компаниями. На этом фоне американский проект DeepSeek призван стать вызовом и ответом одновременно — амбициозной попыткой возродить и укрепить лидерство в области открытого искусственного интеллекта, чтобы сохранить открытый и надежный доступ к самым передовым технологиям для исследователей и разработчиков по всему миру. Америка традиционно была одним из мировых центров разработки ИИ благодаря сильным научным школам, технологиям и инфраструктуре. Такие модели, как Gemini, Claude и o3, а также мощные вычислительные платформы на базе решений Nvidia демонстрируют, что США располагают одним из лучших технологических наборов в индустрии. Тем не менее, последние тенденции свидетельствуют о том, что доля влияния Америки в развитии открытых и академических ИИ-исследований снижается.
В то же время китайские организации активно выпускают значимые открытые модели и обширные датасеты, охватывающие широкий спектр модальностей — от текста до робототехники и видео. Это смещение баланса связано с несколькими структурными преимуществами китайской стороны: большим количеством исследователей, доступом к уникальным объемам данных и более открытым, по сути своей, подходом к развитию открытого программного обеспечения в области ИИ. В противоположность этому, американские технологические лидеры, такие как Meta, начинают пересматривать свои стратегии в сторону меньшей открытости из-за организационных изменений и политического климата, который снижает привлекательность США для лучших мировых специалистов. Прекращение практики открытого обмена научными результатами, которая, по сути, стимулировала прогресс вокруг таких систем, как ChatGPT до 2022 года, ведет к тому, что ключевые «прорывы трансформерного» масштаба вероятнее всего будут построены на основе китайских моделей, чипов и идей. И хотя сотрудничество и профессиональные связи с китайскими инженерами остаются высокоэффективными и полезными, есть значительные опасения по поводу доверия, ответственности и прозрачности таких систем, учитывая тесные связи с государственными структурами Китая.
Проект American DeepSeek ставит своей целью в течение ближайших двух лет создать полностью открытые модели искусственного интеллекта на уровне современных публичных передовых систем. Ключевой особенностью здесь является именно полная открытость — открытые веса модели дополняются данными, кодом для обучения, журналами и описаниями решений, позволяя всем желающим воспроизводить и детально понимать процесс создания этих систем. Такая полнота открытости позволяет не просто использовать ИИ для вывода результатов, а полноценную демократизацию знаний и технических средств, необходимых для обучения собственных моделей. Главная задача проекта — вернуть статус исследовательского центра ИИ западным технологиям, а также снизить риск монополизации передовых продуктов на базе закрытых, коммерческих моделей. Сейчас многие открыто говорят о мечте доступного для всех общего искусственного интеллекта, но на практике очень немногие вкладываются в реализацию этой идеи.
По оценкам Nathan Lambert, это потребует инвестиций от ста до пятисот миллионов долларов только в вычислительные ресурсы за ближайшие два года. В условиях современной геополитической и технологической конкуренции времени остается мало. Если не начать немедленно, то глобальное развитие искусственного интеллекта может оказаться в пропасти между закрытыми американскими системами и открытыми китайскими моделями. Однако оба этих варианта имеют существенные недостатки. Закрытые западные системы ограничивают доступ и прозрачность, а китайские открытые модели вызывают вопросы доверия из-за отсутствия независимости и связи с авторитарным режимом.
Американская DeepSeek станет попыткой создать альтернативу, заслуживающую доверия и открыто доступную для мировой исследовательской и коммерческой экосистемы. Важным аспектом проекта является взаимодействие с новыми парадигмами в развитии ИИ — в частности с агентными системами, которые сочетают и используют множество моделей в рамках единой архитектуры для решения разнообразных задач. Такой подход значительно эффективнее по сравнению с фокусом на поэтапном наращивании производительности отдельных больших моделей. По мере выхода таких агентных систем, спрос на открытые модели с высоким уровнем производительности будет только расти. Сейчас лучшие открытые языковые модели постепенно приближаются к уровню GPT-4, что является значительным шагом по сравнению с GPT-3.
Проект DeepSeek ориентируется на достижение именно этого этапа — моделей с возможностями, сопоставимыми с современными коммерческими системами вроде Sonnet, DeepSeek V3 или Gemini Pro. Это трансформационный скачок, открывающий новый уровень возможностей широкого применения и адаптации моделей под конкретные задачи. Однако ключевая сложность заключается в том, что сегодня в открытом доступе есть только модели с открытыми весами, но без полного доступа к обучающим данным и коду. Это серьезно ограничивает уровень доверия и повторяемости результатов. Например, ведущие американские проекты сталкиваются с ограничениями лицензионных соглашений, а китайские разработки хотя и открыты, но интегрированы с инструментами и инфраструктурами, которые вызывают опасения с точки зрения безопасности и этики.
Американский проект DeepSeek демонстрирует, что для надежного и справедливого развития ИИ необходимо развивать новые модели взаимодействия, открытости и совместного формирования экосистемы. Вызов, который ставится — не просто создать набор изолированных технологий, а научиться строить экосистемы, где технологии доступны, прозрачны и подотчетны широкой общественности. В более широком контексте, технология искусственного интеллекта, которая проникает во все сферы жизни, становится ровесницей таких фундаментальных открытий как электричество — это инструмент и ресурс, которые должны служить всем без исключения. При этом необходимо создавать надежные механизмы предотвращения злоупотреблений, безопасности и этической ответственности, которые не будут полностью зависеть от корпоративных интересов. Реализация столь амбициозной цели требует широкой поддержки со стороны исследователей, финансовых инвесторов, разработчиков и государственных структур.