В последние годы развитие технологий искусственного интеллекта (ИИ) движется огромными шагами вперёд, открывая невероятные возможности для бизнеса и повседневной жизни. Однако вместе с ростом возможностей всё острее становится вопрос стоимости использования современных моделей языка, которые работают на токенах — основном счётчике вычислительной мощности и объёма переданных данных в системах ИИ. Токены становятся значительно дороже, и это меняет правила игры как для сервисов, так и для их пользователей. Чтобы понять причины удорожания, важно разобраться в самой структуре рынка и тех бизнес-моделях, на которых строятся компании, предоставляющие доступ к ИИ через подписки или плату за использование. Во-первых, многие стартапы и крупные игроки изначально рассчитывали на то, что с каждой новой версией моделей их стоимость будет стремительно снижаться.
В основе такой стратегии лежала идея о том, что вычислительные ресурсы станут дешевле в 10 раз или даже больше каждый год. Это позволяло задумываться о предложении клиентам доступных тарифных планов с перспективой дальнейшего резкого роста маржинальности. Однако на практике происходит совершенно иное. Несмотря на реальное снижение себестоимости моделей предыдущих поколений, большая часть потребителей отходят от них в пользу самых современных и мощных версий ИИ. Если раньше например модель GPT-3.
5 стоила существенно дешевле, чем её преемник GPT-4, то сейчас почти весь спрос сосредоточен именно на последней, более продвинутой версии. Это связано с тем, что пользователи всегда стремятся получить максимально качественное и эффективное исполнение задач, что для ИИ означает использование топовых моделей. Психология выбора «лучшего инструмента» вкупе с растущими требованиями к функционалу ведёт к тому, что дешевле — далеко не значит популярнее. Кроме того, ещё более серьёзной проблемой становится быстро растущий объём потребления токенов на одну сессию. Современные приложения перестали ограничиваться короткими ответами или простыми задачами.
Теперь пользователи ждут глубоких исследований, масштабного анализа, многократного переписывания текстов и комплексного кодирования. Это приводит к тому, что время работы модели и количество сгенерированных токенов удваивается примерно каждые полгода. Результатом становится стремительный рост общих затрат на вычисления, который зачастую значительно превысил ожидания изначальной бизнес-модели. Ещё одним важным фактором является появление и массовое внедрение интеллектуальных агентов, способных работать автономно в течение длительного времени и выполнять сложные многозадачные процессы. Такие системы могут самостоятельно инициировать циклы проверки и оптимизации результатов, не требуя постоянного участия человека.
Это порождает взрывной рост токенов, работающих круглосуточно, что делает плоские тарифы со «безлимитным» доступом невозможными с экономической точки зрения. В попытке справиться с новой реальностью компании пробовали различные стратегии. Одним из ярких примеров является сервис Claude Code, который предложил тариф с максимально возможным безлимитом за $200 в месяц — в десять раз дороже, чем у конкурентов. Для оптимизации расходов они автоматически переключались между более дорогими и дешёвыми версиями модели, а также экспериментировали с использованием вычислительных ресурсов пользователей для снижения нагрузки на собственную инфраструктуру. Но даже такой подход не спас компанию от резкого увеличения затрат и вынужденных ограничений в пользу экономической устойчивости.
В итоге выясняется, что традиционные подписные модели с фиксированной платой не способны выдержать новые масштабы потребления ИИ. Компании оказываются перед выбором: либо принять резкие ограничения на использование, либо перейти на систему оплаты, основанную на фактическом потреблении токенов, что далеко не всегда приемлемо для массового рынка из-за негативного восприятия у пользователей. Этот вызов сравнивают с классической дилеммой заключённого, когда варианты устойчивого развития оказываются нежизнеспособными для каждого отдельного игрока при отсутствии координации всех участников. Одним из направлений решения проблемы становится концентрация на корпоративных клиентах с высокими бюджетами и длительными контрактами. В таких случаях сложная интеграция, высокая стоимость внедрения и необходимость соблюдения стандартов безопасности создают барьеры для быстрой смены поставщиков, что позволяет поддерживать стабильную маржинальность.
Именно поэтому многие крупные вендоры ориентируются на узкие рынки с крупными предприятиями, а не на широкую публику. Другой путь — вертикальная интеграция, когда компания не просто продаёт доступ к языковым моделям, а предоставляет полный спектр связанных сервисов: хостинг приложений, базы данных, мониторинг развертывания и другие инструменты, обеспечивая комплексное решение. Такой подход позволяет потерять деньги на самих языковых моделях, компенсируя расходы за счёт остальной инфраструктуры и сервисов. Вертикально интегрированные платформы тем самым получают более устойчивую экономику и могут позволить себе быть лидерами на рынке. Тем не менее, компании, которые продолжают придерживаться классической модели роста с низкой ценой и неограниченным доступом, рискуют оказаться в положении банкротов с огромными долгами по инфраструктуре.
В индустрии уже появляются первые жертвы такой стратегии, когда проекты вынуждены сворачивать предложения, снижать планы по развитию или уходить с рынка. В целом, плавное ожидание резкого падения стоимости вычислений, которое спасёт рентабельность бизнеса в ИИ, оказалось утопией. Новые вызовы — это растущий спрос на качество и глубину обработки, а также экспоненциальное увеличение объёмов работы моделей. Понимание сложившейся ситуации заставляет игроков пересматривать бизнес-модели и искать пути к устойчивому развитию через гибкое ценообразование, корпоративные решения и инфраструктурные инновации. Потребителям в такой ситуации стоит привыкать к тому, что использование ИИ становится всё более стратегическим ресурсом, требующим осознанных вложений и грамотно выстроенного процесса в компании.
Это отличие от привычного массового потребления контентных сервисов, таких как стриминговые платформы, и отражение превращения ИИ в мощный профессиональный инструмент. В перспективе рынок ждет формирование нового поколения сервисов, умеющих динамически масштабировать вычислительные ресурсы под задачи пользователей и предлагать гибкие тарифы, а также построение экосистем с вертикальной интеграцией, где языковые модели — только один из компонентов. Все это ведёт к тому, что искусственный интеллект выходит на этап зрелости, где экономика технологий становится решающим фактором в успехе компаний и уровне доступа пользователей. Таким образом, удорожание токенов — не просто «техническая» или «временная» сложность. Это системный вызов, глубоко меняющий правила рынка и заставляющий всех участников адаптироваться к новым реалиям.
Вопрос ценности, качества и затрат становится центральным и определяет дальнейшее направление развития искусственного интеллекта в ближайшие годы.