С момента выхода китайской крупномасштабной языковой модели DeepSeek прошло более 128 дней, и этот период позволил оценить её влияние на рынок искусственного интеллекта, динамику пользовательских предпочтений и конкурентный ландшафт технологии. DeepSeek, сравнимая с решениями таких компаний, как OpenAI, вызвала настоящий фурор благодаря своей способности к сложному рассуждению и при этом очень низкой стоимости на входные и выходные токены. Тем не менее, развитие ситуации и дальнейшие метрики рынка указали на значительные сложности, с которыми сталкивается эта модель, и на её нестабильное доминирование. В настоящем обзоре подробно рассматривается тенденции, связанные с DeepSeek спустя 128 дней после запуска, а также обсуждаются основные концепции токеномики, технические ограничения и стратегические направления развития на фоне мирового соперничества в области ИИ. Запуск DeepSeek стал знаковым событием для китайской технодолины и всего индустриального сообщества, поскольку модель стала первой, по заявлению разработчиков, публично доступной с уровнем рассуждений, сопоставимым с OpenAI.
Потрясенная рынок ценовая политика – $0.55 за входной токен и $2.19 за выходной, что более чем в 90% ниже цены западных аналогов того времени – вызвала тревогу у западных игроков. Столь низкая стоимость быстро спровоцировала изменение всей модели ценообразования для ИИ-сервисов, и, как ответ, OpenAI существенно снизила цены на свои ключевые модели. Этот этап стал свидетельством начала новой эры в индустрии искусственного интеллекта, где цена за токен становится критическим рыночным конкурентным фактором.
Однако всплеск интереса и резкий скачок посещаемости DeepSeek вскоре сменились спадом. Аналитические данные показывают, что несмотря на значительный рост числа пользователей в первые дни после запуска, показатели его рыночной доли для собственного веб-сервиса и API постепенно снижаются. Особенно ярко это проявляется в западных странах, где данные по трафику свидетельствуют о снижении популярных запросов к DeepSeek, в то время как другие ведущие провайдеры ИИ набирают аудиторию. В то же время сторонние хостинги и партнерские платформы, которые интегрируют модель DeepSeek, наоборот, демонстрируют многократный рост использования, указывая на своеобразную «зомбификацию» уникального пользовательского трафика внутри официальных каналов DeepSeek. Причина подобной динамики кроется в сложной системе токеномики и ключевых показателях производительности, на которые ориентируются все провайдеры.
Токен, являясь единицей измерения для входных и выходных данных, используется в ценообразовании и полностью определяет коммерческую стоимость обслуживания запросов. Основные показатели, которые влияют на цену токена, включают задержку первой выдачи (time to first token), скорость генерации каждого последующего токена (interactivity) и размер контекстного окна, вмещающего количество токенов в «короткой памяти» модели. DeepSeek сознательно жертвует скоростью отклика и объемом контекста для удержания низких цен. Их собственный сервис предлагает минимальную стоимость, но требует от пользователей ждать несколько секунд до получения первого слова, что заметно хуже по сравнению с конкурентами, такими как Parasail или Friendli, которые предлагают те же или схожие цены, но с минимальной задержкой. В дополнение, традиционное контекстное окно DeepSeek ограничено 64 тысячами токенов, что меньше в 2.
5 и более раза по сравнению с некоторыми западными провайдерами. Это ограничение сказывается на таких критичных задачах, как анализ больших кодовых баз и длинных текстов, где требуется сохранение большого объема контекста для адекватных рассуждений и качественного вывода. Технически DeepSeek решает проблему удешевления токенов очень высокой степенью батчинга — объединения множества запросов в рамках одного GPU для оптимизации вычислительных ресурсов. Такой подход, с одной стороны, снижает затраты, с другой – ухудшает пользовательский опыт за счет увеличения латентности и снижения скорости генерации. Причем важно понимать, что подобная стратегия является целенаправленной бизнес-политикой компании.
Вместо того, чтобы делать ставку на максимальную монетизацию сервисов и удовлетворение пользователей, DeepSeek сосредотачивается на освоении передовых технологий ИИ и движется к цели создания искусственного общего интеллекта (AGI). Ограничения китайской индустрии, в том числе из-за экспортного контроля и дефицита вычислительных ресурсов для масштабного инференса, заставляют DeepSeek использовать внутренние мощности максимально эффективно и открывать исходный код модели для развития экосистемы через внешних хостеров. Так китайская экосистема сохраняет преимущество в тренировке моделей, несмотря на сложные условия с распространением и эксплуатацией. Это отличие усиливает раскол между китайскими и западными ИИ-платформами, где китайские организации обладают мощным потенциалом в разработке, но испытывают проблемы с масштабированием инференса за счет аппаратных и регуляторных барьеров. В то же время ситуация на Западе не менее стремительна и интересна.
Компании вроде Anthropic демонстрируют, что ограниченность вычислительных ресурсов можно компенсировать оптимизацией архитектуры моделей и использования токенов. Их успехи в области инструментов для программистов, таких как Claude Code, показывают, что сфокусированное применение моделей в практических задачах обеспечивает устойчивый рост популярности. Несмотря на сравнительно высокую цену и нехватку быстродействия, модели Anthropic выигрывают за счет меньшего количества генерируемых токенов и лучшего пользовательского опыта. Такой подход формирует новый вектор развития индустрии, где важна не просто вычислительная мощность, а эффективность каждого токена и удобство для конечных потребителей. Поддержка со стороны индустриальных гигантов, таких как Amazon с крупными поставками специализированных процессоров Trainium, а также Google с TPU, усиливает позиции западных игроків и открывает новые возможности для масштабирования.
Эти стратегические альянсы позволяют Anthropic и другим игрокам оптимизировать используемые мощности как для тренировки, так и для инференса, что в итоге повышает скорость работы и качество моделей. В структуре рынка все активнее появляются так называемые «облака инференса» — сервисы, которые не просто предоставляют модели пользователям, но и предлагают доступ к токенам как к продукту. Такие платформы, включая Cursor, Windsurf, Replit и Perplexity, стремятся стать универсальными пространствами для создания и использования ИИ-инструментов, расширяя применение модели за рамки традиционного общения и превращая ИИ в гибкий сервис с множеством сценариев использования. Рассматривая перспективы DeepSeek, существуют слухи о задержках с выпуском второго поколения модели (R2), что подчеркивает сложность и высокую стоимость разработки передовых ИИ-систем. В то же время открытый подход к исходному коду и сотрудничество с внешними провайдерами создают благоприятные условия для долгосрочного улучшения модели и расширения ее глобального влияния.
Эксперты предупреждают, что в текущих условиях DeepSeek не стремится конкурировать в традиционном понимании с OpenAI или Google на уровне пользовательского опыта, а больше ориентирован на накопление знаний и технологической базы для достижения AGI. В итоге, анализируя опыт DeepSeek спустя 128 дней после релиза, можно сделать вывод, что модель сыграла важную роль в изменении ценовой политики и рыночных ожиданий в ИИ индустрии. Несмотря на ухудшение пользовательских показателей собственного хостинга, популярность модели на внешних платформах и открытость исходного кода обеспечивают ей значительное присутствие. Стратегия, основанная на компромиссах между ценой, скоростью и объемом контекста, отражает текущие технологические и регуляторные реалии, в которых работает китайский сектор ИИ. В то же время усилия западных компаний по масштабированию вычислительных ресурсов и оптимизации использования токенов формируют конкурентное и динамичное поле, в котором победит тот, кто сумеет предложить лучшую эффективность и удобство конечным пользователям.
Предстоящие месяцы и годы обещают стать ключевыми для всего мира искусственного интеллекта, где DeepSeek и его конкуренты будут искать баланс между инновациями, доступностью и качеством обслуживания, создавая фундамент для следующей волны прорывных технологий.