Технология блокчейн Виртуальная реальность

Масштабируемость моделей рассуждений: возможности и перспективы развития искусственного интеллекта

Технология блокчейн Виртуальная реальность
How far can reasoning models scale?

Анализ перспектив масштабирования моделей рассуждений и влияние вычислительных ресурсов на прогресс в области искусственного интеллекта. Исследование текущего состояния, вызовов и перспектив развития методов обучения и применения интеллектуальных моделей нового поколения.

Модели рассуждений, такие как инновационная серия OpenAI o3, занимаются решением сложных задач, требующих логического мышления, анализа и умозаключений. За период менее года они смогли произвести впечатляющий прорыв в своих возможностях, быстро улучшая результаты на разнообразных сложных бенчмарках по математике, программированию и другим областям. Однако возникает справедливый вопрос: насколько далеко можно масштабировать такие модели, используя существующие подходы и вычислительные мощности? Основным направлением в развитии этих моделей является обучение с использованием подкрепления, когда системе дают обратную связь на выполненные задачи, что позволяет улучшать её способность рассуждать. Такая стадия обучения проводится после предварительного обучения на огромных объёмах данных, и именно она считается ключевой для формирования высокоуровневых навыков рассуждения. Исторически масштаб вычислительных ресурсов всегда был важнейшим фактором прогресса в ИИ.

В частности для моделей рассуждения, скорость наращивания используемого вычислительного объёма впечатляет. Примером служит скачок от модели o1 к o3 — увеличение объёма вычислений для обучения при использовании подкрепления произошло в 10 раз всего за четыре месяца. Если подобные темпы роста продолжатся, то вплоть до ближайшего года масштаб вычислений для обучения рассуждению достигнет максимально возможного уровня для нынешних технологий. Но что это означает для роста способности моделей? К сожалению, ускоренное увеличение вычислительных ресурсов необязательно будет бесконечным. Экспериментальное и теоретическое понимание показывает, что вскоре темпы расширения подобных вычислений замедлятся и приблизятся к общему росту вычислительных мощностей — примерно 4 раза в год.

Следовательно, усовершенствования в возможностях рассуждения могут значительно замедлиться после достижения этой точки насыщения. Неполнота данных от крупнейших разработчиков, в том числе OpenAI, затрудняет точную оценку масштабов вычислительных затрат на обучение моделей рассуждений. Известно, что OpenAI озвучила данные о том, что o3 потребовал примерно в 10 раз больше вычислительной мощности на обучение с подкреплением, чем o1. По оценкам исследователей, аналогичные модели вроде DeepSeek-R1 обучались на примерно 6е23 FLOP, что соотносится с вложениями около миллиона долларов. С другой стороны, разные компании используют разнообразные стратегии обучения.

Некоторые модели, например Nvidia Llama-Nemotron Ultra и Microsoft Phi-4-reasoning, проходили менее интенсивное обучение с подкреплением, а большую часть работы выполняла подготовка в форме супервизированного fine-tuning на синтетических данных. Это означает, что сложно сравнивать вычислительные затраты на разных этапах, учитывая разнообразие подходов и типов данных. Опыт показывает и говорит о том, что затраты на обучение моделей рассуждений всё ещё не достигли масштабов самых больших тренировочных запусков в истории ИИ. Тем не менее, разрыв с этими пиковыми значениями составляет всего несколько порядков величины, что позволяет предполагать, что рост вычислительных ресурсов для моделей рассуждений может ещё продолжаться в обозримом будущем. Как это сказывается на прогрессе в ИИ? С одной стороны, если вычислительные ресурсы, выделяемые на модели рассуждений, всё ещё сравнительно малы по сравнению с общим потенциалом, то, вероятно, можно ожидать быстрых улучшений в короткие сроки при дальнейших увеличениях масштабов обучения.

Показательным является пример o3, который не только получил 10-кратное увеличение вычислений относительно o1, но и показал значительный скачок в решении сложных задач, включая математику и программирование. Кроме того, масштабируемость моделей рассуждений пока не регулируется надёжными законами обучения, как это происходит с моделями предобучения. Тем не менее, графики производительности моделей демонстрируют куда более линейный, практически логарифмический рост с увеличением объёма вычислений. Это делает вероятным ещё несколько этапов быстрого прогресса, если вычислительные мощности будут масштабироваться. Однако, есть весомые ограничения.

Масштабирование вычислений не является единственным препятствием. Нарастают вопросы, связанные с загрузкой подходящих учебных данных. Обучение с подкреплением требует нового набора сложных и разнообразных задач, а их исчерпаемость ставит под сомнение возможность продолжения эффективного масштабирования. Кроме того, способность моделей хорошо рассуждать вне строго формализованных областей, например в более абстрактных и неоднозначных сферах знаний, пока вызывает сомнения. Дополнительный аспект — высокая стоимость экспериментов.

Разработчики вынуждены запускать многочисленные параллельные исследования, тестируя разные типы задач, методы оценки и алгоритмы, что значительно увеличивает суммарные расходы и время создания моделей. В итоге общие затраты на разработку могут превышать напрямую измеримый расчет обучающих процедур. Несмотря на это, есть основания полагать, что инженеры и исследователи ещё недостаточно реализовали весь потенциал новых парадигм обучения моделей рассуждений. Известные эксперты в индустрии, включая Dario Amodei из Anthropic и сотрудников OpenAI, уверены в том, что быстрое масштабирование возможно и будет инициировать существенный рост возможностей. Ведущие компании сфокусированы на том, чтобы преодолеть узкие места, связанные с качеством данных, методами оценки и эффективностью вычислений.

Автоматическая торговля на криптовалютных биржах Покупайте и продавайте криптовалюты по лучшим курсам Privatejetfinder.com (RU)

Далее
Ask HN: Is anyone using Super Grok Heavy for code?
Четверг, 23 Октябрь 2025 Опыт использования Super Grok Heavy для программирования: реалии и перспективы

Подробный обзор возможностей и особенностей модели Super Grok Heavy для написания и отладки кода, а также сравнение с популярными альтернативами и практические советы по эффективному применению в реальных задачах разработки.

Turbo Encabulator
Четверг, 23 Октябрь 2025 Турбо инкапулятор: легенда технического жаргона и инженерной шутки

Турбо инкапулятор — известный пример научно-технического фарса, являющийся классикой инженерного юмора и технического бреда. История и значение этого термина раскрывают, как сложный профессиональный язык может стать источником веселья и сатиры в научном сообществе.

Remembrance of Things Past: The Leopard (2010)
Четверг, 23 Октябрь 2025 Вечная Ностальгия и Политика в Фильме «Леопард» (2010): Киношедевр Лукино Висконти

Фильм «Леопард» (2010) Лукино Висконти, основанный на романе Джузеппе ди Лампедуза, представляет собой глубокую и многогранную картину об утрате и переменах в обществе. История о судьбах аристократии, политической трансформации и неизбежности перемен, «Леопард» не просто экранизация, а самостоятельное произведение, затрагивающее вечные темы прошлого и настоящего.

Lead GrapheneOS developer was forcibly conscripted into a war
Четверг, 23 Октябрь 2025 Как призыв ведущего разработчика GrapheneOS повлиял на будущее проекта и безопасность мобильных устройств

Рассмотрение последствий принудительного мобилизации ключевого разработчика GrapheneOS для проекта, трудностей программного обеспечения на базе Android 16 и роли сообщества в поддержке развития безопасной операционной системы для мобильных устройств.

G-O-A-L Goals in English football
Четверг, 23 Октябрь 2025 Эволюция голов в английском футболе: анализ тенденций и перспективы

Исследование изменений в количестве голов в английском футболе с момента основания лиг в 1888 году до современности. Анализирует влияние мировых событий, структурных изменений и финансовых факторов на результаты матчей и предсказывает будущее голевая динамику в разных лигах Англии.

The Decimal Point Is 150 Years Older Than Historians Thought
Четверг, 23 Октябрь 2025 История десятичной точки: открытие на 150 лет старше, чем считалось раньше

Новое исследование выявило, что десятичная точка была впервые использована на целых 150 лет раньше, чем полагали историки, благодаря итальянскому математику и астроному Джованни Бианкини. Это открытие меняет представления об истории математики и ее развитии в эпоху Возрождения.

San Diego County's Schools Have 27,000 Fewer Students Than a Decade Ago
Четверг, 23 Октябрь 2025 Важные изменения: почему количество учеников в школах Сан-Диего за десять лет сократилось на 27 000

Рассмотрены причины существенного снижения числа учащихся в школах округа Сан-Диего за последнее десятилетие, влияние этого тренда на образовательную систему и прогнозы на будущее местного школьного образования.