Стартапы и венчурный капитал

DeepMind и OpenAI достигли Золота на Международной математической олимпиаде: что это значит для развития ИИ

Стартапы и венчурный капитал
DeepMind and OpenAI achieve IMO Gold. What does it all mean?

Глубокий анализ достижений ИИ-систем DeepMind и OpenAI на Международной математической олимпиаде, их значение для науки, технологий и будущего искусственного интеллекта.

В последние годы искусственный интеллект демонстрирует поразительные успехи в самых разных областях — от обработки естественного языка до медицины и творчества. Одним из самых впечатляющих достижений стал успех систем DeepMind и OpenAI на Международной математической олимпиаде (IMO), где обе модели сумели заработать «золото» — высокое достижение, сопоставимое с результатами одних из лучших школьников-математиков планеты. Однако что именно означают эти результаты и насколько они значимы для развития AI и науки в целом? Попробуем разобраться. Международная математическая олимпиада — престижное ежегодное соревнование, которое собирает сотни одарённых учащихся со всего мира. Конкурс охватывает сложнейшие задачи, которые требуют глубокого понимания, творческого подхода и способности к многошаговому рассуждению.

Максимум очков на олимпиаде — 42, что соответствует решению шести задач за два дня. Получить золотую медаль — значит оказаться среди примерно восьми процентов сильнейших конкурсантов. Системы DeepMind и OpenAI набрали по 35 баллов из 42. Это показатель, по уровню которого их можно можно сравнить с 45 участниками, достигшими такого же результата. Иными словами, АИ решили задачи на уровне топовых школьников мира.

Правда, стоит отметить, что 26 конкурсантов в 2025 году обошли по очкам машины, а только пять получили идеальный результат. Такие достижения вызывают восхищение. Первыми хочется отметить сложность и глубину математических задач — они не сводятся к простому вычислению, а требуют комплексного анализа, построения доказательств и изобретательности. Ранее ни одна из существующих моделей не могла похвастаться даже бронзовой медалью. Годом ранее DeepMind смогла набрать 28 очков, что соответствует серебру, однако машинам приходилось прибегать к помощи в подготовке и работать дольше по времени, чем у людей.

Интересно, что DeepMind и OpenAI подошли к выполнению экзамена по-разному. DeepMind тесно сотрудничала с организаторами IMO, выполняла тест под их контролем, а правильность решений оценивалась официальными судьями. OpenAI же устроила испытание своей системы самостоятельно, не афишируя деталей метода и объявила успех ещё до официального завершения соревнований. Такие различия вызвали серьезный резонанс и дискуссии в научном сообществе. Известный математик Терри Тао раскритиковал отсутствие прозрачности OpenAI, отказавшись признавать результаты компаний в условиях, где нет четко установленных и контролируемых правил.

Это подчеркивает идеологический разрыв между научной культурой, в которой ценятся проверяемость и открытость, и корпоративным подходом, ориентированным на PR и маркетинг. Отсутствие детальной информации о структуре и методах обучения этих ИИ-систем — еще одна тема для обсуждения. DeepMind не раскрывает подробностей, но упоминает использование новых методов обучения с подкреплением и доступ к обширному корпусу качественных решений математических задач. OpenAI позиционирует свою модель как широкомасштабный «языковой» ИИ с экспериментальными подходами к обучению, однако не даёт технических подробностей. По этой причине многие эксперты называют достижения ИИ скорее знаковыми с точки зрения демонстрации потенциала новых технологий, чем финальной точкой.

Несмотря на впечатляющие результаты на IMО, не факт, что эти системы смогут в краткосрочной перспективе стать полноценными математиками — теми, кто генерирует новые гипотезы, придумывает оригинальные концепции и ведёт глубокие фундаментальные исследования. Успех на олимпиаде подтверждает высокую способность к решению сложных задач в рамках установленного формата, но не даёт гарантий, что ИИ сможет полноценно взаимодействовать с неструктурированной научной информацией или творчески подходить к исследовательской деятельности — ключевые показатели настоящего научного прогресса. Для практического использования важную роль играет качество решений. Анализ показать, что хотя обе системы правильно решают задачи, стиль и структура ответов различаются. DeepMind выдаёт ответы, близкие к идеалу — элегантные, хорошо структурированные доказательства, которые могли бы быть опубликованы в научных журналах или учебниках без серьёзной доработки.

OpenAI же часто генерирует длинные и менее ясные решения, напоминая слегка неряшливую устную речь, что снижает удобство восприятия и вызывает сомнения в полноте понимания. Не менее важна экономическая составляющая. Руководители в промышленности и науке заинтересованы в эффективных и доступных инструментах с разумными затратами ресурсов. Пока что ни DeepMind, ни OpenAI не раскрывают, сколько вычислительных ресурсов и времени требуется для таких успехов, но предварительные оценки указывают на значительные затраты электроэнергии и высокую стоимость инфраструктуры. В долгосрочной перспективе стоит также учитывать, смогут ли данные системы интегрироваться с внешними инструментами — вычислительными средствами, поиском информации, программированием.

Это повысит их гибкость и поможет решать более широкий спектр научных и инженерных задач. Одним из волнующих вопросов остаётся поведение ИИ с задачей номер 6 — самой сложной на олимпиаде. Ни одна из моделей не смогла решить её полноценно, что подчёркивает текущие ограничения даже высокоразвитых систем и открывает пространство для дальнейших исследований и улучшений. Эксперименты с версиями Gemini Pro 2.5, Demonstrated Yichen Huang и Lin Yang продемонстрировали, что с помощью продвинутых методов промптинга и многократного взаимодействия с системой можно попытаться преодолеть сложные задачи, однако такие подходы требуют значительного вмешательства и советов, что может сказываться на универсальности и автономности решений.

В целом можно сделать вывод, что результат DeepMind и OpenAI — скорее новый этап в эволюции ИИ, свидетельство прогресса в сложных областях интеллектуальной деятельности. Несмотря на определённые скептические взгляды и критику, они показывают возможности технологий, которые в ближайшие годы могут преобразить не только математику, но и весь спектр научного поиска. Одновременно результаты выявляют ограничения и открывают вопросы, требующие систематического изучения и прозрачного сотрудничества между компаниями-разработчиками, научным сообществом и обществом в целом. В эпоху стремительного развития ИИ важно критически оценивать достижения, сохранять внимание к методологии и учиться на успешных и проблемных примерах. Лишь так можно обеспечить разумное интегрирование искусственного интеллекта в научную и образовательную сферы, не теряя человеческий фактор и творческую составляющую, на которых основывается настоящий прогресс.

Подводя итог, можно сказать, что «золото» на IMO для DeepMind и OpenAI — заметный рубеж, подчеркивающий возможности современных ИИ-систем, но не финишная линия. От будущих разработок зависит, смогут ли машины выйти за рамки экспертных систем и стать действительно новаторскими участниками в мире науки и техники.

Автоматическая торговля на криптовалютных биржах Покупайте и продавайте криптовалюты по лучшим курсам Privatejetfinder.com (RU)

Далее
Ask HN: DHH on Lex, a multi-hour ode to Ruby on Rails, but is it any good?
Четверг, 30 Октябрь 2025 Ruby on Rails под микроскопом: стоит ли следовать советам Дэвида Хейнмейера Ханссона?

Обзор дебатов и мнений вокруг популярного веб-фреймворка Ruby on Rails, подкреплённый анализом интервью с его создателем Дэвидом Хейнмейером Ханссоном и обсуждениями разработчиков с разных сторон.

Show HN: Kidsafe360 – Free Mobile Tracker and Parental Control App
Четверг, 30 Октябрь 2025 KidSafe360 – Лучшее приложение для контроля и безопасности детей в цифровом мире

KidSafe360 – это современное решение для родителей, обеспечивающее безопасность детей и контроль над их деятельностью в интернете и на мобильных устройствах. Узнайте, как это приложение поможет защитить ребенка, отслеживать его местоположение и управлять временем использования гаджетов.

Current state of MCP OAuth: A work in progress
Четверг, 30 Октябрь 2025 Текущие тенденции и перспективы развития MCP OAuth: процесс совершенствования

Погружение в современные аспекты и этапы развития MCP OAuth, раскрытие ключевых проблем и решений, влияющих на безопасность и удобство аутентификации в современных цифровых системах.

What is Maximal Extractable Value (MEV)?
Четверг, 30 Октябрь 2025 Максимальная извлекаемая стоимость (MEV): что это такое и как влияет на блокчейн

Подробное объяснение концепции максимальной извлекаемой стоимости (MEV), её роль в экосистеме Ethereum и децентрализованных финансах, а также влияние на пользователей и перспективы решения проблем, связанных с MEV.

If Every Worker in America Earned the Same Paycheck, What Would Happen to the Economy?
Четверг, 30 Октябрь 2025 Что произойдет с экономикой США, если все работники будут получать одинаковую зарплату

Рассмотрение потенциальных последствий для экономики США в случае введения единой заработной платы для всех работников, анализ мотивации, производительности и социальных изменений в обществе.

CME Earnings Surge on Volatility, Increased Trading
Четверг, 30 Октябрь 2025 Резкий рост прибыли CME на фоне волатильности и увеличения объема торгов

Исследование факторов, способствующих значительному росту прибыли CME Group благодаря повышенной волатильности на рынках и возросшему объему торгов, а также влияние этих изменений на финансовый сектор и инвесторов.

MOG Coin Doubles in a Month — Is a 250% Rally Next?
Четверг, 30 Октябрь 2025 MOG Coin: Взрывной рост за месяц и перспектива роста на 250%

MOG Coin продемонстрировал впечатляющий рост за последний месяц, преодолев ключевые уровни сопротивления и привлечь внимание трейдеров по всему миру. В статье разбираются технические и фундаментальные факторы, которые могут привести к новой волне роста, а также объясняется, почему ожидается потенциал повышения цены на 250%.