Понимание человеческого мышления всегда являлось одной из ключевых задач в науках о разуме. Для создания единой теории когнитивных процессов требовалось нечто большее, чем набор разрозненных моделей, которые описывали лишь отдельные аспекты поведения. Недавно ученые разработали фундаментальную модель под названием Centaur, способную предсказывать и моделировать поведение человека практически в любой экспериментальной среде, выражаемой в естественном языке. Эта разработка стала возможной благодаря синтезу современных технологий в области больших языковых моделей и массивных данных о человеческом поведении, собранных в масштабном датасете Psych-101. Psych-101 — это уникальный набор данных, включающий в себя информацию о более чем 60 000 участников, выполнивших свыше 10 миллионов выборов в 160 разнообразных экспериментах из областей принятия решений, обучения, памяти и других когнитивных дисциплин.
Все эти эксперименты были транскрибированы в удобный для обработки языковой моделью текстовый формат, что позволило создать универсальную структуру для представления разноплановых сценариев взаимодействия человека с окружающей средой. Centaur основан на базе одной из передовых языковых моделей – Llama 3.1 70B, разработанной Meta AI. Главная инновация заключается в том, что вместо полной дообучения модели применялась технология parameter-efficient fine-tuning под названием QLoRA, добавляющая низкоранговые адаптеры, которые обеспечивают тонкую настройку на задачах, связанных с предсказанием человеческого поведения, не изменяя базовые параметры модели. Такой подход не только экономит вычислительные ресурсы, но и повышает качество обобщения.
Эта модель показала выдающуюся точность в предсказании поведения участников, которые не входили в обучающую выборку, переигрывая большинство специализированных когнитивных моделей. Более того, Centaur сохраняет высокую производительность, сталкиваясь с изменениями в сценариях экспериментов: будь то изменение обложки задания, модификация структуры задач или даже совершенно новые области, к примеру, виды логического мышления, которые вовсе не входили в тренировочный набор. Такой уровень универсальности позволяет считать Centaur фундаментальной основой для построения интегрированных теорий человеческого когнитивного функционирования. Интересно, что варианты поведения, порождаемые Centaur при моделировании в «открытом режиме», отражают разнообразие стратегий, которое наблюдается среди реальных людей. Например, в тестах по исследованию стратегий исследования и выбора модель демонстрирует аналогичные уровни направленного и случайного поиска информации, а в задачах с двойным процессом обучения показывается микс между модельно-независимым и модельно-ориентированным обучением — ключевыми механизмами, признанными в когнитивных науках.
Дополнительно исследователи обнаружили, что несмотря на то, что модель училась только прогнозировать поведение, ее внутренние представления после дообучения становятся все более сопоставимы с человеческой нейронной активностью, измеряемой с помощью функционального МРТ. Это свидетельствует о том, что Centaur не просто имитирует внешние проявления поведения, но и отражает глубинные процессы обработки информации, что открывает перспективы для взаимного обогащения когнитивной науки и нейронауки. Применение модели не ограничивается лишь предсказанием ответов участников. В одном из кейсов, исследователи использовали Centaur и Psych-101 для разработки более точной и при этом интерпретируемой когнитивной модели принятия решений в задачах с несколькими атрибутами. Система автономно генерировала гипотезы и помогала выявить нюансы в поведении, которые не были уловлены классическими подходами.
Такая интеграция искусственного интеллекта и когнитивных исследований задает новые стандарты для автоматизированного анализа и научного открытия в психологии. В контексте задач искусственного интеллекта Centaur демонстрирует, что можно создавать модели, не просто обучающиеся конкретным задачам, но способные к универсальному пониманию и прогнозированию человеческой мысли и поведения. Такой уровень абстракции становится первой ступенью на пути к построению единой теории познания — одной из наиболее амбициозных целей психологической науки. В будущем планируется расширить датасет Psych-101, включив в него больше областей: социальную психологию, экономические игры, эксперименты с индивидуальными особенностями участников, а также данные из различных культурных и возрастных групп. Это позволит делать модель еще более всеобъемлющей, гибкой и способной к учету многообразия человеческого опыта.
Centaur открывает множество перспектив для исследования человеческого мозга и разума. Так, анализ внутренних функций модели может дать зондирование стратегий представления знаний и обработки информации у человека, а также генерацию гипотез для последующих экспериментальных проверок. Кроме того, платформы типа Centaur могут использоваться для оптимизации экспериментального дизайна: прогнозируя, какие задачи и условия вызывают наиболее значимые поведенческие эффекты, сокращая время и ресурсы на проведение исследований. Подводя итоги, можно утверждать, что Centaur – это революционная разработка, сочетающая мощь больших языковых моделей и глубинное понимание психологии. Она устанавливает новую парадигму для объединения когнитивных наук с искусственным интеллектом и нейробиологией, показывая, каким образом можно перейти от разрозненных подходов к единой системе понимания человеческого мышления.
Открывая пути для автоматизации и ускорения научного прогресса, эта модель является мощным инструментом для будущих исследований и приложений в самых разных областях от психологии до разработки человеко-ориентированных AI-систем.