Человеческий разум — одна из самых сложных и загадочных систем, созданных природой. Его универсальность проявляется в способности выполнять как простые повседневные задачи, так и решать сложнейшие проблемы, требующие творческого и логического мышления. Несмотря на значительный прогресс в психологии и когнитивных науках, до сих пор не существовало единого компьютерного решения, способного моделировать поведение человека во множестве разнообразных ситуаций. Проект Центур (Centaur) стал прорывом в этой области — это фундаментальная модель человеческого познания, разработанная для предсказания и имитации человеческого поведения во всех экспериментах, описываемых на естественном языке. Центур был создан путем тонкой настройки передовой языковой модели, основанной на архитектуре Llama 3.
1 с 70 миллиардами параметров, на уникальном наборе данных Psych-101. Этот набор включает в себя более 10 миллионов выборов, сделанных более чем 60 тысячами участников в 160 различных психологических экспериментах. Благодаря естественно-языковым описаниям экспериментов, модель получает возможность обрабатывать широкий спектр когнитивных задач — от многоруких бандитов и принятий решений до обучающих процессов и работы с памятью. В отличие от существующих моделей, специализирующихся на узких областях, Центур демонстрирует впечатляющие способности к обобщению. Модель превосходит классические когнитивные модели, часто основанные на ограниченных гипотезах и теориях, в прогнозировании поведения как участников, входивших в тренировочный набор данных, так и тех, которые не были представлены ранее.
Более того, Центур хорошо справляется с экспериментами с модифицированными сюжетами, изменениями структуры задач и даже с совершенно новыми доменами, что свидетельствует о высоком уровне адаптивности и гибкости. Центур не просто предсказывает поведение, он способен генерировать человеческие ответные действия, что является более сложной задачей, поскольку в этом случае модель должна инициировать последовательность поведенческих реакций без внешних подсказок. Такие симуляции проводились в нескольких условных задачах, например, в «horizon task», где изучается стратегия исследования и эксплуатации нескольких вариантов выбора. Результаты показали, что модель достигает уровня производительности, сопоставимого с реальными людьми, и демонстрирует характерные для человека поисковые стратегии, включающие направленное исследование неопределённости. Уникальной особенностью Центура стала способность его внутренних представлений улучшать соответствие нейронной активности человеческого мозга.
Был проведён анализ функциональной магнитно-резонансной томографии (фМРТ) у испытуемых, проходивших задачи, аналогичные тем, которые обрабатывала модель. Представления из различных слоёв модели преимущественно связывались с различными областями мозга, демонстрируя, что тонкая настройка на поведенческие данные сказывается и на уровне нейрональных коррелятов. Разработка и настройка Центура осуществлялась с помощью эффективного метода параметрической оптимизации — QLoRA, позволяющего сохранять параметры базовой модели неизменными, при этом добавляя небольшое количество адаптеров низкого ранга. Благодаря этому достигается баланс между сохранением масштабных знаний языковой модели и специализированной подгонкой под поведенческие паттерны человека. Обучение на всем множестве Psych-101 заняло около пяти дней на мощном графическом процессоре.
Что касается практического применения, Центур открывает беспрецедентные возможности для когнитивной науки. Модель выступает инструментом для автоматизированного проектирования экспериментов, позволяя предсказывать варианты, которые приведут к наиболее значимым результатам, снижая при этом временные и ресурсные затраты на проведение исследований. На основе полученных данных и предсказаний можно разрабатывать новые теории, тестировать гипотезы и создавать более интерпретируемые модели человеческого поведения. Одна из интересных областей применения — модельно-ориентированное научное открытие. В исследовании по многокритериальному принятию решений было показано, как Центур помог выявить новые комбинации стратегий выборов участников.
Первоначальная гипотеза, порождённая языковой моделью DeepSeek-R1, была усовершенствована с использованием информации, полученной от Центура, что привело к созданию более точной и гибкой модели, лучше объясняющей данные экспериментов. Перспективы развития включают расширение набора данных Psych-101 и включение дополнительных доменов, таких как психолингвистика, социальная психология, экономические игры, временные аспекты когнитивных процессов и межкультурные исследования. Важной задачей станет интеграция информации об индивидуальных различиях — социально-демографических, возрастных и личностных характеристиках, что поможет делать более персонализированные прогнозы. В будущем возможно обучение аналогичных или более совершенных моделей с нуля на базе этого обширного и разнообразного корпуса психологических данных. Это позволит глубже исследовать архитектуру человеческого мышления, сравнивать различные подходы — например, модели, основанные на внимании, или с векторной памятью.
Такой синтез откроет двери для формирования единой теории когнитивного процесса, сочетающей модульные специализированные структуры с универсальными механизмами. Среди имеющихся ограничений — склонность текущего формата данных к естественно-языковому описанию, что может упустить некоторые неформализуемые либо трудно формализуемые аспекты когнитивных исследований. Поэтому завершается путь к мультиформатному представлению данных для достижения ещё большей гибкости и полноты моделей. Центур являет собой пример того, как высокоразвитые технологии машинного обучения и крупномасштабные психологические данные могут быть объединены для создания исчерпывающего инструмента, отражающего сложность человеческого разума. Его успехи во множестве конкордатных тестов ранее предложенного «когнитивного десятиборья» демонстрируют устойчивость и потенциал подхода, открывая дорогу к объединению когнитивной науки и искусственного интеллекта на новом уровне.
Центур не просто модель — это фундамент для будущего, где понимание человеческой природы и разработка интеллектуальных систем станут единым процессом, стимулируя прогресс науки, медицины, образования и других сфер жизни человека.