Понимание человеческого сознания и поведения в самые разные моменты жизни уже давно является одной из важнейших задач современной науки и психологии. Разработка универсальной модели, способной предсказать поведение в разнообразных условиях, помогает создать основу для единой теории когниции, объединяющей многочисленные направления исследований и экспериментов. Одним из наиболее значимых достижений в этом направлении стала модель Centaur, разработанная путем тонкой настройки крупной языковой модели с использованием большого массива психологических данных. Мозг человека — это невероятно сложная и универсальная система. Мы одновременно можем принимать самые простые повседневные решения — вроде выбора завтрака — и решать сложнейшие задачи, связанные с научными открытиями или творчеством.
Человеческий разум способен быстро обучаться, рассуждать причинно-следственным образом и мотивировать себя через любопытство. Однако большинство современных моделей в машинном обучении и когнитивных науках имеют ограниченную сферу применения и стараются фокусироваться на узких задачах. К примеру, компьютерные системы, победившие в сложных играх, таких как Go, превосходны именно в них, но не в состоянии выйти за их рамки. Модель Centaur позволяет преодолеть это ограничение. Она построена на базе Llama 3.
1 70B — передовой языковой модели с 70 миллиардами параметров, созданной компанией Meta AI. Для адаптации к задаче предсказания человеческого поведения специалисты использовали метод Quantized Low-Rank Adaptation (QLoRA), добавив лишь небольшое количество дополнительных параметров, которые оптимизируются для данной цели. Это позволило максимально эффективно использовать знания, уже содержащиеся в исходной языковой модели, сохраняя при этом высокую производительность и гибкость. Основой для обучения Centaur стал масштабный датасет Psych-101, который содержит данные с более чем 60 тысяч участников, сделавших свыше 10 миллионов выборов в рамках 160 разнообразных психологических экспериментов. В этих данных охвачены такие области, как теория игр, обучение с подкреплением, исследование памяти, процессы принятия решений и многие другие психологические парадигмы.
Каждое экспериментальное задание было переведено в естественно-языковой формат, что позволило унифицировать разнообразные протоколы и сделать данные пригодными для обработки языковой моделью. Проверка качества модели Centaur показала, что она превосходит не только базовую модель без дополнительной настройки, но и широко признанные доменно-специфические когнитивные модели. Centaur точнее предсказывает поведение участников, которые не участвовали в обучающей выборке, что свидетельствует о ее способности к обобщению. Более того, модель успешно справляется с ситуациями, когда меняется контекст задачи, например, при модификации «обложек» экспериментов, структурных изменениях заданий и при исполнении задач из новых, ранее не встречавшихся областей. Особенный интерес вызывают исследования того, насколько внутренние представления модели соотносятся с активностью человеческого мозга, зарегистрированной с помощью функциональной магнитно-резонансной томографии (фМРТ).
Несмотря на то, что Centaur не обучалась специально на нейронные данные, ее внутренние слои оказались значительно более согласованы с реальной нейронной активностью людей в психологических экспериментах, чем исходная языковая модель. Это открывает перспективы использования модели в качестве инструмента для изучения нейронаучных основ когниции. На практике Centaur может быть применена для автоматизации анализа больших объемов экспериментальных данных, разработки новых когнитивных гипотез и создания более точных и интерпретируемых моделей человеческого поведения. В частности, с помощью модели исследователи смогли проанализировать данные многокритериального выбора, выявляя комбинированные стратегии, используемые людьми, которые ранее не были официально описаны в литературе. Использование Centaur в схеме научного минимизации «сожаления» (scientific regret minimization) позволяло выявить ошибки и неточности других моделей, указывая на необходимость их доработки и уточнения.
Потенциал модели Centaur выходит далеко за пределы имитации поведения. Она может служить основой для построения экспериментальных прототипов в виртуальной среде, позволяя оптимизировать дизайн исследований, снижать необходимый размер выборок и повышать статистическую мощность. Централизованная база данных Psych-101 продолжает расширяться, и в перспективе предполагается включение данных из психолингвистики, социальных наук, экономики и других областей, что повысит общую универсальность и качество обучения модели. Кроме того, разработчики отмечают важность учета индивидуальных различий между участниками, таких как возраст, культура, личностные черты и социально-экономический статус. Включение этих факторов в модели позволит создавать более персонализированные и точные предсказания, а также лучше понять, как эти характеристики влияют на поведение и когнитивные процессы.
Переход к более комплексным, многомодальным форматам данных станет следующим шагом в развитии подобных моделей. Интеграция текстовой информации с визуальными, аудиовизуальными и другими типами данных позволит моделям захватывать нюансы человеческого восприятия и действий, недоступные при работе с исключительно текстовыми форматами. В целом, появление модели Centaur знаменует собой важное событие в когнитивных науках и искусственном интеллекте. Она доказывает, что возможно построить единую, универсальную модель, способную совпадать с поведением и внутренними нейронными процессами человека в широком спектре задач. Это открывает двери не только для более глубокого понимания природы человеческого разума, но и для новых методов диагностики, обучения и поддержки принятия решений.
Развитие и доступность модели и датасета Psych-101 на открытых платформах способствует прозрачности исследований и стимулирует сотрудничество ученых со всего мира. В дальнейшем важной задачей станет перевод результатов, полученных с помощью Centaur, в теоретические модели, объединяющие отдельные когнитивные процессы в целостную структуру, что приблизит научное сообщество к давно желанной единой теории сознания. В мире, где понимание человеческой психики становится ключом к развитию технологий и улучшению качества жизни, Centaur становится инструментом, способным раскрыть тайны мышления и поведения, делая огромный шаг к границам познания себя и других.