Человеческий разум — удивительное явление, объединяющее в себе способность принимать простые решения повседневной жизни и решать невероятно сложные задачи, такие как излечение болезней или освоение космоса. При этом когнитивные способности человека отличаются универсальностью и гибкостью: мы учимся на практике, строим причинно-следственные связи и часто двигаемся вперед, подпитываясь любопытством и стремлением к познанию. И в то время как развитие искусственного интеллекта достигло впечатляющих высот, современные модели, как правило, остаются узкоспециализированными и ограниченными отдельной областью применения. Например, система AlphaGo великолепно овладела игрой в Го, однако вне контекста игры её возможности крайне ограничены. Аналогично и многие классические когнитивные теории описывают лишь отдельные аспекты человеческого мышления, не охватывая всю его сложность и многообразие.
Переход от узконаправленных моделей к единой теории когниции — долгосрочная цель психологии, призванная интегрировать знания о человеке из разных областей в целостное понимание. Важнейшим первым шагом к этому стало создание вычислительной модели, способной предсказывать человеческое поведение во множестве разнообразных экспериментальных условий и задач. Недавний прорыв в этой области — модель Центур (Centaur), которая была разработана на базе передовой языковой модели и дообучена на беспрецедентном наборе данных Psych-101, включающем десятки миллионов решений более 60 тысяч участников свыше 160 психологических экспериментов. Psych-101 выступает в роли уникального хранилища глубокой информации о человеческом поведении. Эксперименты в нем охватывают разные области, такие как принятие решений, обучение, память, процессы планирования и исследования, а также задачи, связанные с многорукими бандитами, вероятностным и причинным мышлением и другими ключевыми аспектами когниции.
Важной особенностью Psych-101 стало описание всех эксприментов в виде естественного языка, что превращает самые разные задачи в универсальный формат и позволяет работать с ними на одном языке, открывающем доступ к мощным языковым моделям. Модель Центур представляет собой дообученную языковую модель Llama 3.1 с 70 миллиардами параметров, которая при помощи метода параметрически эффективного дообучения QLoRA получила адаптеры, позволяющие ей концентрироваться именно на моделировании человеческого поведения. Такой подход позволил сохранить весь богатый опыт базовой модели и при этом значительно повысить способность точно воспроизводить и предсказывать реакции людей в самых разнообразных ситуациях. Обучение потребовало всего одной эпохи на огромном датасете и заняло около пяти дней на продвинутом графическом процессоре.
Центур демонстрирует впечатляющие результаты в прогнозировании поведения новых участников, которых не было в обучающей выборке. Она превосходит как исходную языковую модель без дообучения, так и весь набор специальных когнитивных моделей, разработанных для каждого эксперимента отдельно. Модель проявляет устойчивость к изменениям условий, может справляться с новыми, ранее не встречавшимися историями и вариантами задач, а также способна выдавать человечески релевантные ответы в новых предметных областях. Примером этому служит успешное моделирование изменённых условий известных экспериментальных парадигм, таких как задача двух шагов с альтернативным сюжетом и трёхрукий бандит, расширяющей классическую двухвариантную задачу. При этом Центур способна воспроизводить не только усредненное поведение, но и всю совокупность вариантов стратегий участников, что проявляется в распределении результатов и характеристик их принятия решений.
К примеру, в моделировании задачи двух шагов она генерирует реакции, свойственные как полностью модельно-свободному, так и полностью модельно-ориентированному обучению, а также их гибридным формам. Такая способность особенно ценна для исследования индивидуальных различий и сложных когнитивных процессов. Модель также не ошибается при распознавании «нечеловеческого» поведения, корректно снижая качество предсказаний для автоматических агентов и демонстрируя высокую точность лишь в отношении людей. Это подчеркивает её специфику и надежность в сфере моделирования человеческой психологии. Ключевым достижением стала не только способность Центура прогнозировать поведение, но и то, как внутренняя структура модели отражает нейронные процессы мозга.
Исследователи провели корреляционные анализы с функциональными томографиями отдельных участников, что показало более тесное соответствие представлений модели и активности мозга по сравнению с исходной языковой моделью. Эта согласованность не была заложена явно в обучении, но вскрылась благодаря масштабному подгонке под данные психологии, свидетельствуя о глубоком сходстве процессов обработки информации. Практическое применение Центура и Psych-101 простирается далеко за рамки задач ретроспективного анализа экспериментов. Они становятся мощными инструментами для автоматизированного открытия новых когнитивных стратегий, что демонстрируется на примере работы с многоаспектной задачей принятия решений. С помощью языковой модели DeepSeek-R1 была сгенерирована качественная объяснительная гипотеза, заимствованная из поведенческих данных, которую затем формализовали в вычислительную модель.
Хотя эта модель уже показывала улучшения по сравнению с классическими гипотезами, она всё еще отставала по точности от Центура. Используя метод «научного минимизирования сожалений» (scientific regret minimization) — подход, в котором опорная мощная модель помогает выявлять ошибки и упущения в объяснении, — исследователи усовершенствовали формальный когнитивный механизм, добившись сопоставимой с Центур точности и сохранения интерпретируемости. Это демонстрирует, как Современные языковые модели и масштабные корпуса данных позволяют обогатить и ускорить процесс научного исследования в психологии. В дальнейшем модель Центур может стать отправной точкой для создания глубоко интегрированной и универсальной теории человеческой когниции. Разбор её внутренних механизмов с помощью подходов визуализации внимания и автокодирования открывает новые горизонты для понимания представления знаний и процессов обработки информации в мозге.
Кроме того, использование альтернативных архитектур на основе Psych-101 позволит исследовать, насколько человеческая когниция близка к языковым трансформерам или другим типам нейробиологических и вычислительных моделей. Коллекция данных Psych-101 также будет регулярно расширяться, включая в себя новые области науки о поведении человека — от социально-психологических исследований и психолингвистики до психиатрии и исследований индивидуальных различий. Это поможет моделям научиться учитывать влияние различных факторов, включая культурные, демографические и личностные характеристики, что крайне важно для создания максимально универсального и обоснованного научного продукта. В дополнение к этому, модельный формат данных приветствует стандартизацию и объединение усилий с другими научными сообществами, особенно в нейронауках, с целью создания общих платформ и протоколов, расширяя таким образом возможности междисциплинарных исследований. Таким образом, Центур является первым шагом в новую эпоху понимания человеческого разума, основанную на синтезе искусственного интеллекта и когнитивных наук.
Она ломает барьеры специализированных моделей, предлагая комплексный, масштабный и высокоточный инструмент для прогнозирования, анализа и открытия тайн нашего мышления, открывая двери к единой теории когниции. Прогресс в этой области сулит не только глубокое академическое понимание, но и практические приложения в образовании, медицине, разработке интерфейсов человек-компьютер и многих других сферах, где знание устройства человеческого разума жизненно важно.