Мероприятия

Почему большие языковые модели не способны создавать внутренние модели мира: выводы исследования Гарварда и MIT

Мероприятия
LLMs fail to demonstrate internal world model, according to Harvard/MIT study

Обзор важного исследования от Гарварда и MIT, в котором рассматривается способность больших языковых моделей формировать внутренние модели мира и объясняются ограничения современных фундаментальных моделей ИИ в понимании и интерпретации сложных физических закономерностей.

Современный мир стремительно развивается благодаря достижениям искусственного интеллекта, где в центре внимания сегодня находятся большие языковые модели (LLM). Эти модели, основанные на обработке и предсказании последовательностей текста, становятся все более мощными и широко применяемыми в различных областях — от генерации текста до помощи в научных исследованиях. Однако несмотря на очевидный прогресс, недавно опубликованное исследование ученых из Гарвардского университета и Массачусетского технологического института проливает новый свет на пределы возможностей LLM. Речь идет о неспособности таких моделей формировать устойчивую и адекватную внутреннюю модель мира, которая бы позволяла им понимать и объяснять фундаментальные физические закономерности и абстракции за пределами простого выявления паттернов в данных. Исследование с названием «What Has a Foundation Model Found? Using Inductive Bias to Probe for World Models», опубликованное в 2025 году в рамках Международной конференции по машинному обучению (ICML), демонстрирует систематический подход к выявлению того, насколько крупные фундаментальные модели способны адаптироваться к новым задачам и учитывать базовые законы, управляющие реальностью.

Авторы использовали метод, называемый индуктивным биас-пробой (inductive bias probe), который позволяет проверить, совпадает ли индуктивное предубеждение модели с предполагаемой моделью мира — простым абстрактным описанием, из которого были сгенерированы синтетические данные для обучения и тестирования. Для примера они взяли модели, обученные на данных, описывающих орбитальные траектории тел по законам Ньютона, и проверили, смогут ли эти фундаментальные модели применить знания о классической механике при переходе к новым задачам, связанным с физическими явлениями. Результаты показали, что, хотя модели превосходно решали исходные тренировочные задачи, они демонстрировали удивительную неспособность к обобщению и переносу фундаментальных закономерностей. Фактически, LLM создавали не универсальные представления о природе физики и мира, а скорее набор узкоспециализированных эвристик, хорошо работающих только в рамках обучения. Такой феномен является серьезным вызовом для сообщества исследователей, поскольку принципиальная цель использования моделей искусственного интеллекта — именно выявление глубинной структуры и закономерностей, которые позволили бы системам адаптироваться и развиваться в новых условиях.

Основываясь на последовательности из текста и данных, LLM добиваются высокой точности прогнозов и генераций в пределах известного, но когда задача требует понимания физических законов или моделирования сложных систем, они оказываются бессильными без явного программного вмешательства или добавления дополнительных структур знаний. Исследователи подчеркивают, что это свидетельствует о фундаментальном различии между тем, как люди формируют ментальные модели мира, и тем, как современные ИИ обучаются и принимают решения. В отличие от животных и людей, которые с раннего возраста строят и корректируют внутренние представления о причинно-следственных связях, времени и пространстве, фундаментальные модели пока лишь подражают паттернам без глубинного понимания. Следовательно, LLM не обладают внутренним абстрактным миром, а они скорее сложные статистические модели, работающие с большим объемом данных и предсказывающие вероятности последующих токенов, не более. Эта особенность поднимает важные вопросы о будущем развития искусственного интеллекта.

Во-первых, необходимо признать, что простое увеличение размеров моделей и объема тренировочных данных не ведет автоматически к формированию истинного понимания и внутренней модели мира. Прогресс в этой области потребует внедрения новых архитектур, которые смогут сочетать обучение с символьным рассуждением, причинно-следственным мышлением и, возможно, новыми способами симбиоза с внешними базами знаний. Во-вторых, открытие ограничений текущих фундаментальных моделей помогает скорректировать ожидания как специалистов в области ИИ, так и пользователей, которые на них опираются. Многие уже склонны считать LLM фактически универсальными интеллектуальными системами, способными заменить человеческий мозг во всех сферах. Однако реальность показывает, что без внутреннего представления о мире они более эффективны как мощные инструменты обработки и генерации информации, нежели существа с самостоятельным пониманием.

Несомненно, исследование команды из Гарварда и MIT станет центральным моментом для научных дискуссий в области разработки и оценки ИИ. Их методика индуктивного биас-проба предоставляет мощный инструмент для дальнейшего анализа и тестирования моделей, позволяя выяснить, какие именно «предубеждения» помогают машинам обучаться, и насколько глубокими эти предубеждения являются. Кроме того, данный подход может быть применим к различным областям машинного обучения, выходя за рамки только физики или моделирования мира, и стимулировать создание новых алгоритмов, которые не просто имитируют закономерности, но и понимают причины. В заключение стоит отметить, что для создания настоящих интеллектуальных систем, способных на самостоятельное мышление и адаптацию, необходимо гораздо больше, чем покрытие огромных массивов данных и совершенствование архитектур нейросетей. Требуется фундаментальное переосмысление принципов обучения и представления знаний, что открывает новые горизонты для исследователей и инженеров по всему миру.

В обозримом будущем именно такие знания и подходы помогут превзойти современные ограничения и приблизить создание машин с настоящим внутренним пониманием и моделью мира, а не только с алгоритмическими эвристиками. В итоге открытие, полученное благодаря совместной работе ученых из Гарварда и MIT, служит важным сигналом для всей индустрии. Оно напоминает о том, что на пути к искусственному общему интеллекту ещё предстоит преодолеть значительные вызовы и исследовать новые пути, которые выведут технологии машинного обучения на качественно иной уровень.

Автоматическая торговля на криптовалютных биржах Покупайте и продавайте криптовалюты по лучшим курсам Privatejetfinder.com (RU)

Далее
Medieval medicine was smarter than you think – and similar to TikTok trends
Среда, 22 Октябрь 2025 Средневековая медицина: умнее, чем вы думаете, и удивительно похожа на современные тренды TikTok

Новые исследования показывают, что медицина Средневековья была гораздо более продвинутой и рациональной, чем принято считать. Многие методы и рецепты того времени удивительно перекликаются с современными оздоровительными трендами, набирающими популярность в социальных сетях, особенно в TikTok.

Cellulose instead of crude oil: Researchers develop sustainable foams
Среда, 22 Октябрь 2025 Целлюлоза вместо нефти: устойчивые пены нового поколения от исследователей Технического университета Граца

Устойчивые клеточные материалы на основе целлюлозы открывают новые перспективы для промышленности, предлагая экологичную альтернативу нефтяным пенам с широким спектром применения — от автомобильной безопасности до спортивного инвентаря. Технология производства и возможности биодеградации делают эти материалы ключом к экологическому будущему.

Hyperreal Specifications for Continuous Sparse Data Computations [video]
Среда, 22 Октябрь 2025 Гиперреальные спецификации для непрерывных вычислений на разреженных данных: революция в обработке информации

Подробное исследование современных методов обработки разреженных данных с использованием гиперреальных спецификаций, их значимость в сфере непрерывных вычислений и перспективы внедрения в различные отрасли.

Profiling Crosswords' Rendering Pipeline
Среда, 22 Октябрь 2025 Анализ и оптимизация процесса рендеринга головоломок GNOME Crosswords

Подробное исследование этапов рендеринга головоломок в GNOME Crosswords с акцентом на выявление узких мест производительности и пути улучшения работы программного обеспечения для комфортного отображения больших объемов данных.

The Machine Stops (1909) [pdf]
Среда, 22 Октябрь 2025 «Машина останавливается» Э. М. Форстера: пророчество о будущем технологий и общества

Рассказ Э. М.

Packages Proxies
Среда, 22 Октябрь 2025 Прокси для Пакетов: Обеспечение Быстрого и Надежного Доступа к Репозиториям

Прокси для пакетов играют важную роль в оптимизации работы с репозиториями программного обеспечения, ускоряя загрузку, снижая нагрузку на внешние ресурсы и повышая стабильность процессов разработки и CI/CD.

Building Grafana dashboards with AI, CLI and a bit of pragmatism
Среда, 22 Октябрь 2025 Создание панелей Grafana с помощью ИИ, CLI и прагматичного подхода

Погружение в эффективные методики построения панелей мониторинга Grafana с использованием искусственного интеллекта, командной строки и практических решений, которые помогут оптимизировать работу и повысить качество визуализации данных.