Продажи токенов ICO

Новый эксперимент с Отелло подтверждает гипотезу о мировых моделях для больших языковых моделей

Продажи токенов ICO
New Othello experiment supports the world model hypothesis for LLMs

Исследования Университета Копенгагена демонстрируют, что большие языковые модели могут формировать внутренние представления сложных игровых пространств, решая задачи, связанные с пониманием правил и структуры, используя только последовательности ходов в игре Отелло.

Последние достижения в области искусственного интеллекта продолжают удивлять и расширять границы нашего понимания возможностей больших языковых моделей (БЯМ). Исследование, проведенное в Университете Копенгагена, сосредоточилось на проверке так называемой гипотезы мировой модели на примере игры Отелло — стратегической настольной игры с простыми, но глубоко структурированными правилами. В основе эксперимента лежал вопрос: могут ли языковые модели, обученные исключительно на последовательностях ходов в игре, понять правила, конфигурацию доски и логику игры, не имея визуальных данных или формальных описаний? Ответ на этот вопрос открывает новую главу в развитии ИИ и понимании того, как машины интерпретируют и абстрагируют информацию из текстовых данных. Гипотеза мировой модели для больших языковых моделей ставит во главу угла идею о том, что такие модели способны строить внутренние представления, или «карты» сложных структурных объектов, исходя из анализа последовательностей данных. В случае с Отелло это означает, что модель может реконструировать конфигурацию игрового поля и определить, какие ходы допустимы в каждом конкретном положении, руководствуясь лишь текстовой историей завершенных или текущих партий.

Данное предположение радикально отличается от традиционного взгляда, согласно которому языковые модели лишь статистически прогнозируют следующий элемент последовательности без глубинного понимания правил или смысла. В своем исследовании команда из Дании обучила семь различных языковых моделей, включая GPT-2, T5, Bart, Flan-T5, Mistral, LLaMA-2 и Qwen2.5, с целью предсказания последующих ходов в партиях Отелло. Особенность эксперимента заключалась в использовании двух различных наборов данных: один включал около 140 тысяч реальных игр, второй — миллионы синтетически сгенерированных партий. Применение последних позволило проверить, насколько обучение на искусственных данных влияет на способность моделей усваивать внутренние закономерности и структурные связи.

Одной из главных инноваций, которую реализовали исследователи, стал метод представления и сравнения внутренних карт, формируемых моделями. Специальные инструменты репрезентационного выравнивания дали возможность напрямую оценить, насколько внутренние «видения» доски у различных моделей совпадают друг с другом и соответствуют реальной структуре игры. В отличие от предыдущих попыток, таких как проект OthelloGPT, которые имели ограничения в интерпретации результатов, данное исследование предложило более строгий и прозрачный анализ способностей моделей. Результаты показали, что все модели не только научились эффективно прогнозировать ходы, но и формировали схожие внутренние представления о пространственной структуре игровой доски. Эти представления включали в себя понимание расположения клеток, а также правил захвата и переворота фишек, что свидетельствует о глубоком абстрактном понимании механики игры.

В частности, при обучении на большом объеме реальных данных показатели ошибок в предсказаниях упали ниже шести процентов для большинства моделей, тогда как на синтетических данных с увеличением объема наблюдалось снижение ошибок с приблизительно пятидесяти процентов на 2000 партиях до менее 0,1 процента на всём наборе данных. Интересно, что модели, предварительно обученные на большом корпусе языковых данных, такие как Flan-T5 и LLaMA-2, не всегда демонстрировали превосходство над моделями, изначально не имевшими языковой подготовки. Это стало сильным аргументом в пользу идеи, что для формирования внутренней модели игры Отелло достаточно информации о ходах, а не знания естественного языка. Таким образом, данный эксперимент бросает вызов общепринятому мнению о том, что языковым моделям нужен широкий контекст и разнообразные данные для абстрактного понимания «миров» вне текстового плана. По мнению авторов исследования, Юфея Юаня и Андерса Сегора, полученные выводы имеют важное значение не только для разработки более совершенных ИИ-систем, но и для фундаментальных вопросов в философии искусственного интеллекта, таких как проблема символической привязки.

Символическая привязка подразумевает установление связи между формальными символами и реальными, осмысленными объектами мира. В контексте игры Отелло символы обозначают конкретные позиции на доске, и способность модели ассоциировать их с конкретным пространственным расположением является свидетельством решения части этой сложной проблемы. Эксперимент также опровергает стереотип о том, что игровые пространственные задачи требуют визуальной информации. Доказано, что даже последовательности ходов, записанных в текстовом формате, могут дать языковой модели достаточно «материала» для построения сложных пространственных представлений. Это важная веха для ИИ, поскольку многие реальные задачи требуют оперирования визуальной, пространственной, а зачастую и многомодальной информацией.

Данный научный прогресс грозит изменить взгляд на возможности и ограничения больших языковых моделей. Если подобные внутренние мировые модели действительно формируются, это может означать, что ИИ способен развивать некую аналогию понимания, аналитику структур и отношений, выходящую далеко за рамки простого запоминания и воспроизведения шаблонов. Более того, это фундаментально приближает технологии к решению задач сознания и осмысленного поведения машин, обостряя философские дебаты о природе интеллекта. Более глубокое понимание механизмов построения таких мировых моделей может повлиять на развитие новых алгоритмов обучения и архитектур, способных переносить приобретённые знания и абстракции в различные сферы. Например, успешное обучение без визуальных данных в игре Отелло поднимает вопрос о возможности обучения языковых моделей абстрактному мышлению в других задачах, где важна пространственная логика и последовательное принятие решений.

Автоматическая торговля на криптовалютных биржах Покупайте и продавайте криптовалюты по лучшим курсам Privatejetfinder.com (RU)

Далее
Ask HN: What water do you drink?
Среда, 17 Сентябрь 2025 Какую воду вы пьёте? Исследование привычек употребления воды в разных странах

Узнайте о разнообразных привычках потребления воды по всему миру: от бутилированной до фильтрованной и необработанной воды из-под крана. Рассмотрены вопросы качества, безопасность и предпочтения людей в разных регионах.

OSDay 2025 – Why Choose to Use the BSDs in 2025 – IT Notes
Среда, 17 Сентябрь 2025 Почему BSD остаются актуальными в 2025 году: взгляд эксперта с OSDay Florence

Разбираемся, почему операционные системы BSD сохраняют свою востребованность и уникальные преимущества в 2025 году, анализируем их особенности, стабильность, безопасность и философию разработки в современном IT-мире.

A Historic Photo: Torvalds and Gates Together
Среда, 17 Сентябрь 2025 Линус Торвальдс и Билл Гейтс вместе: исторический момент в мире ИТ

Уникальный снимок, на котором вместе запечатлены основатель Linux Линус Торвальдс и сооснователь Microsoft Билл Гейтс, символизирует изменения в отношениях между двумя великими фигурами технологий и отражает современные тренды взаимодействия между открытым исходным кодом и корпоративным IT.

17% rise in tax evasion and avoidance among wealthy individuals
Среда, 17 Сентябрь 2025 Рост уклонения и избежания налогов среди богатых на 17%: причины, последствия и меры борьбы

Анализ значительного увеличения уклонения и избежания налогов среди состоятельных граждан в Великобритании, выявление основных причин роста, влияние на экономику и обзор усилий налоговых органов по борьбе с этим явлением.

Stocks Set to Open Higher as Investors Shrug Off U.S. Attack on Iran, PCE Inflation Data and Powell’s Testimony Awaited
Среда, 17 Сентябрь 2025 Рынки акций на подъеме: Инвесторы игнорируют удары США по Ирану, ожидая данные по инфляции и выступление Пауэлла

Глобальные фондовые рынки демонстрируют устойчивость несмотря на инаугурационные военные действия США против Ирана. Инвесторы внимательно следят за ключевыми экономическими показателями и предстоящей речью главы Федеральной резервной системы Джерома Пауэлла, формируя ожидания относительно будущих тенденций на фондовом рынке и мировой экономике.

Argo to buy UGI’s gas storage and supply assets in Hawaii
Среда, 17 Сентябрь 2025 Argo расширяет энергетическое присутствие на Гавайях: покупка газовых активов UGI

Argo Infrastructure Partners приобретают ключевые газовые хранилища и снабженческие активы у UGI на Гавайских островах, укрепляя свою роль в обеспечении энергетической стабильности региона. Это стратегическое приобретение расширяет возможности компании и поддерживает развитие инфраструктуры газа в штате.

Is Fox Stock Outperforming the Nasdaq?
Среда, 17 Сентябрь 2025 Акции Fox Corporation: превосходит ли рост Nasdaq? Анализ актуальных данных и прогнозы

Подробное рассмотрение динамики акций Fox Corporation на фоне индекса Nasdaq. Оценка результатов компании, сравнительный анализ с Nasdaq и перспективы инвестирования в FOX с учетом последних финансовых отчетов и экспертных мнений.