В последние десятилетия познание человеческого мышления стало одной из самых сложных и многогранных задач для науки. Психология, нейронаука, когнитивные науки и искусственный интеллект стремятся понять, как работает наш мозг, как мы принимаем решения и как формируется поведение. Однако до недавнего времени большинство моделей имели узкую направленность и ограничивались конкретными доменами, что затрудняло создание единой теории когниции. Революционный прорыв в этой области связан с разработкой «Центура» (Centaur) — фундаментальной модели когнитивных процессов, созданной на основе современных больших языковых моделей и обученной на рекордно крупном наборе данных из области психологии — Psych-101. Эта модель способна предсказывать поведение человека с беспрецедентной точностью и обобщаться на новые, ранее не встречавшиеся задания и ситуации.
Psych-101 является уникальным в своем роде датаcетом, в который вошли данные по выбору более 60 тысяч участников из 160 различных психологических экспериментов с общей численностью свыше 10 миллионов действий. Эксперименты охватывают широкий спектр когнитивных задач, таких как многорукие бандиты, процессы принятия решений, память, обучение с учителем, марковские процессы и многое другое. Такой масштаб и разнообразие дают возможность модели учиться на уникальных паттернах человеческого поведения и адаптироваться к самым разным условиям. Центур создан на базе Llama 3.1 70B — одной из самых мощных открытых языковых моделей от Meta AI.
Используя технологию параметрически эффективной настройки с низкоранговыми адаптерами (QLoRA), разработчики смогли дообучить Centaur на Psych-101 без изменения основной модели, добавляя лишь дополнительные слои адаптации. Благодаря этому удалось сохранить общие знания модели и при этом «настроить» ее способность предсказывать человеческое поведение. Процесс обучения занял около пяти дней на мощных графических процессорах A100 80GB. Глубокое тестирование модели показало, что Centaur превосходит не только исходную языковую модель без докачки, но и лучшие специализированные когнитивные модели в большинстве экспериментов. Она не просто повторяет поведение среднестатистического участника, но точечно воспроизводит вариативность индивидуальных реакций и стратегий, которые люди используют в разных ситуациях.
Особенно впечатляет способность Центура работать в условиях, далеких от тренировочных: модель успешно предсказывает поведение людей при измененных «оболочках» задач (cover stories), структурных изменениях внутри заданий и даже полностью новых доменах, таких как логическое мышление — область, специально исключенная из тренировочных данных для оценки генерализации. Кроме того, Centaur демонстрирует высокую точность в моделировании распределения стратегий в экспериментах, как, например, двухэтапной задачи, где люди разделяются на сторонников разных типов обучения — моделирующего и немоделирующего. Такая глубина моделирования сложных когнитивных процессов указывает на то, что модель усвоила основные принципы человеческого принятия решений и обучения. Модель также проверяли на способность отличать человеческое поведение от искусственного. В экономических играх Centaur точно предсказывала ответы реальных участников и слабо справлялась с предсказанием действий искусственных агентов, что подчеркивает ее высокую специализацию именно на когнитивных паттернах людей.
Еще одним важным достижением является то, что внутренние представления Centaur тесно коррелируют с нейронной активностью человека, измеренной с помощью функциональной магнитно-резонансной томографии (фМРТ) в различных экспериментах. Модель лучше прогнозирует активность в областях мозга, связанных с выполнением когнитивных задач, чем исходная версия Llama и традиционные когнитивные модели. Это свидетельствует о том, что обучение на большом массиве поведенческих данных ведет к формированию репрезентаций, которые по структуре и смыслу близки к нашим собственным нейронным кодам. Продвинутый кейс использования Centaur — помощь в научном открытии. В одном из исследований с многопризнаковым выбором модель не только предсказала поведение испытуемых, но и помогла сформулировать интерпретируемую вербальную стратегию их решения, а затем оптимизировать и доработать её с помощью метода минимизации научного сожаления.
Это позволило создать когнитивную модель, которая сочетает простоту интерпретации с высокой прогнозной точностью, сопоставимой с Centaur. Перспективы использования таких моделей многогранны. Они могут стать полезным инструментом для автоматизации когнитивных исследований и экспериментов, позволяя создавать виртуальных участников и моделировать различные сценарии без необходимости масштабного сбора данных. Это поможет эффективно разрабатывать дизайн экспериментов, экономить ресурсы и расширять горизонты исследований. В дальнейшем авторы планируют расширять Psych-101, включать новые домены, такие как психолингвистика, социальная психология и межкультурные исследования.
Также важным направлением развития станет интеграция информации об индивидуальных особенностях участников — характере, возрасте, социальных и культурных факторах. Все это позволит сделать модели еще более точными и универсальными. Одна из задач на горизонте — использование моделей нового типа, возможно, с архитектурами, отличными от трансформеров, чтобы глубже понять архитектуру человеческого мышления и информационную организацию мозга. Это откроет путь к разработке более теоретически обоснованных, интегрированных теорий когнитивных процессов. Создание фундаментальных моделей когнитивных процессов, подобных Centaur, является значительным шагом к объединению разрозненных областей когнитивной науки в единую теоретическую и вычислительную парадигму.
Такой подход позволяет преодолеть ограничения узких моделей и продвинуть понимание человеческого разума на новый уровень. В свете этих достижений становится очевидным, что интегрированное, масштабное моделирование — это будущее исследований в области психологии и искусственного интеллекта, и Centaur занимает в этом процессе центральное место. В конечном итоге цель заключается в том, чтобы преобразовать данные и вычислительные мощности в глубокие знания о человеческом познании, сформулировать общую теорию, способную объяснить и предсказывать многообразие наших мыслей, решений и действий. Проекты, подобные Psych-101 и Centaur, доказывают, что эта амбициозная задача становится все более достижимой благодаря объединению современных нейросетевых технологий и огромных данных.