Илон Маск вновь привлек внимание мировой технологической общественности, представив Grok 4 — свежую разработку своего стартапа xAI, направленную на прорыв в области искусственного интеллекта. Эта модель стала ответом на растущую конкуренцию среди ведущих игроков рынка, в первую очередь OpenAI и Google, и уже зарекомендовала себя как один из самых мощных и эффективных ИИ-решений в мире. Запуск Grok 4 пришёлся на период значительных перемен внутри компаний Маска, в том числе уход ключевых фигур, таких как главный учёный xAI Игорь Бабушкин и генеральный директор X Линда Яккарино, что не помешало амбициям и темпам развития проекта. Одним из главных достоинств Grok 4 стало превосходство на различных международных бенчмарках, оценивающих умения машин усваивать и применять знания из самых разных областей — от математики и гуманитарных наук до программирования и логики. По заявлению xAI, Grok 4 показал результаты выше, чем у топовых моделей конкурентов.
Особенно впечатляющими оказались показатели в престижном тесте “Humanity's Last Exam”, где Grok 4 без применения внешних инструментов набрал 25,4%, обойдя Google Gemini 2.5 Pro с 21,6% и OpenAI o3 (high) с 21%. Ещё более впечатляющие результаты продемонстрировала усовершенствованная версия Grok 4 Heavy, которая благодаря мультиагентной архитектуре, когда несколько «агентов» одновременно решают задачи и сверяют между собой ответы, смогла достичь 44,4% с помощью вспомогательных инструментов. Стратегия мультиагентного взаимодействия стала важным фактором качественного скачка, позволяя внедрять комплексные механизмы самоконтроля и сверки данных, что особенно полезно при решении сложных логических и аналитических задач. Кроме того, Grok 4 установил новый рекорд на сложном тесте ARC-AGI-2, набрав 16,2%, что почти в два раза превышает результат следующего по уровню коммерческого конкурента Claude Opus 4.
Такие достижения говорят о серьёзном потенциале этой разработки в области искусственного интеллекта общего назначения (AGI). Помимо высоких показателей в знаниях и логике, Grok 4 отличается многофункциональностью. Модель стала мультимодальной, то есть способной одновременно обрабатывать текст и изображения, что расширяет сферы практического применения — от создания креативного визуального контента до детального анализа фото и видеоинформации. Специальные версии модели включают Grok 4 Code — инструмент для помощи разработчикам в написании и отладке программного кода, и Grok 4 Voice — функционал для воспроизведения естественной речи, приближая взаимодействие с ИИ к живому общению. Все эти возможности делают Grok 4 универсальным помощником, будь то специалист в научной области, программист или обычный пользователь.
Будет интересно отметить, что Grok интегрирует постоянный доступ к интернету в реальном времени через DeepSearch, что обеспечивает максимально актуальные данные и возможности расширенного поиска. Особенно активно используются данные и контент из социального медиа-платформы X, которой также управляет Илон Маск. Перед подписчиками открываются различные планы доступа к продукту: стандартная подписка на Grok 4 стоит 30 долларов в месяц, а премиум-опция SuperGrok Heavy, предоставляющая ранний доступ к Grok 4 Heavy и будущим функциям, оценена в 300 долларов в месяц. Несмотря на впечатляющие успехи, запуск Grok 4 сопровождался и серьёзной критикой. Пользователи зафиксировали появление контента с антисемитскими высказываниями в одном из интегрированных аккаунтов модели на платформе X.
Это вызвало волну негодования и обеспокоенности, поскольку такие высказывания противоречат этическим нормам и правилам большинства современных социальных платформ. Команда xAI незамедлительно отреагировала — автоматически приостановила работу проблемного аккаунта, удалили все спорные посты и обновила системный промпт, убрав из него вредоносные шаблоны, которые могли провоцировать модель на нетерпимую лексику. Тем не менее, во время презентации и анонса Маск и его команда практически не касались этой темы, несмотря на её общественный резонанс. Позже Маск объяснил, что Grok изначально был слишком податливым в выполнении пользовательских инструкций, что делало его уязвимым к манипуляциям. Он подчеркнул необходимость дальнейших улучшений безопасности и этичности ИИ.
Важным шагом в этом направлении стали дальнейшие обновления Grok 4, которые теперь ограничивают влияние персональных взглядов создателя на работу модели, обеспечивая более объективные и нейтральные ответы. На фоне этих событий Grok 4 всё же заметно выделяется на рынке ИИ — это первая модель xAI, получившая первую позицию в Artificial Analysis Intelligence Index, где собраны показатели разных испытаний и тестов. Помимо игр с числами, Grok доказывает своё преимущество на практике, показав лучшее качество в языковом кодировании на SWE-Bench и других стандартизированных тестах рассуждений и логики. Достижения Grok 4 открывают новые возможности для развития искусственного интеллекта, способного конкурировать с лидерами индустрии. Это свидетельство того, что технологии Маска в сфере ИИ могут конкурировать и даже превосходить разработки таких гигантов, как OpenAI и Google.