Понимание человеческого сознания и когнитивных процессов — одна из самых амбициозных и сложных задач современной науки. Психология, нейронауки и когнитивные науки стремятся представить целостную картину работы человеческого разума, однако до недавнего времени существовавшие модели оставались преимущественно узконаправленными, специализировавшимися на отдельных аспектах познания и поведения. Новаторским прорывом в этом направлении стала разработка модели под названием Центур (Centaur), представляющей собой фундаментальную архитектуру для предсказания и моделирования человеческого поведения, способную работать с экспериментами, заданными на естественном языке. Центур была создана путем дообучения высокотехнологичной языковой модели Llama 3.1 70B на едином, масштабном и уникальном датасете Psych-101.
Этот набор данных включает подробные пошаговые решения и выборы более 60 000 участников, охватывая свыше 10 миллионов индивидуальных решений в 160 различных психологических экспериментах. Каждый эксперимент был преобразован в естественно-языковой формат, что позволило интегрировать самые разные парадигмы исследований в единую плоскость и повысить универсальность модели. Главной целью создания Центура стало построение единой, всеобъемлющей теории когнитивных процессов, способной одновременно управлять предсказанием и описанием поведения человека в широком спектре условий. В отличие от классических моделей — таких как теория перспектив, ограничивающихся оценкой принятия решений в экономике или моделей, специализирующихся на воспоминаниях и обучении — Центур доказывает способность к переносимости знаний между разными доменами. Обучение модели проходило с применением эффективной техники параметрической адаптации под названием QLoRA, которая позволила минимизировать число обучаемых параметров, добавляя низкоранговые адаптеры ко всем слоям базовой языковой модели.
Это не только повысило эффективность обучения, но и позволило максимально сохранить исходные знания, полученные в процессе предобучения Llama 3.1. Наиболее важной частью процесса стало маскирование всех токенов, не относящихся к фактическому выбору человека, что сконцентрировало обучение именно на воспроизведении человеческого поведения. Результаты тестов модели превзошли ожидания. Центур показал непревзойденную точность в предсказании поведения новых участников экспериментов, не участвовавших в обучении, а также получил более высокие показатели по сравнению с современными когнитивными моделями, специально разработанными для каждой экспериментальной задачи.
Модель уверенно показала общую способность не только воспроизводить усредненное поведение, но и отражать вариации и распределения решений в пределах популяции, подтверждая тем самым высокую степень когнитивной реалистичности. Одним из уникальных достижений Центура стала его способность успешно справляться с изменениями «сюжетных обёрток» и модификациями структуры задач, которые ранее не встречались в его обучающих данных. Например, для классического эксперимента, в котором исходная история использует космические путешествия для объяснения ситуации, Центур сохранал точность при замене сюжета на волшебные ковры, полностью отражая человеческие ответы. Аналогично, модель показала устойчивость при добавлении опций выбора или переходе к новым, ранее не представленным в тренировочных данных когнитивным доменам. Не менее впечатляюще, что внутренние представления модели, обученной на поведении человека, приобрели значительно большую согласованность с активностью человеческого мозга, зарегистрированной с помощью функциональной магнитно-резонансной томографии (фМРТ).
Анализ качеств таких представлений в различных областях мозга выявил, что Центур превосходит изначально обученную языковую модель Llama, демонстрируя параллели в обработке и восприятии информации между человеком и искусственной системой. Еще одной важной функцией Центура стала возможность генерации человечески правдоподобных последовательностей поведения в ситуациях открытого цикла, что представляет собой сложную задачу для автоматических моделей. Модель не только предсказывает выборы на основе предыдущих событий, но и способна эмулировать каскады решений, создавая реалистичные симуляции когнитивных процессов. Создание Psych-101 как базы для тренировки Центура — это не только прорыв в машинном обучении, но и мощный инструмент для науки. Унифицированный дата-сет предоставляет исследователям доступ к большому количеству экспериментальных данных, из которых можно извлекать общие закономерности.
Кроме того, объединение данных в естественно-языковом формате позволяет легко интегрировать новые исследования и расширять модель на дополнительные области, включая социальную психологию, психолингвистику и экономические игры. Интересным примером применения Центура и Psych-101 стала модельно-ориентированная научная разработка на базе метода «scientific regret minimization» — алгоритма поиска областей, где существующие когнитивные модели слабо предсказывают поведение, но где Центур демонстрирует высокую точность. Благодаря такому подходу удалось сформулировать улучшенные и более интерпретируемые гипотезы о стратегиях принятия решений в задачах с мультиатрибутивным выбором, что значительно продвинуло понимание механизмов когнитивных процессов. Перспективы использования Центура огромны. Уже сейчас модель может служить для автоматизированного прототипирования новых экспериментов, оценки статистической мощности результатов или подбора оптимальных условий исследований.
В будущем возможно глубокое изучение внутренних механизмов модели с помощью методов визуализации внимания и разреженного кодирования, что даст новые идеи и гипотезы о том, как люди представляют и обрабатывают информацию. Безусловно, проект сталкивается и с ограничениями. Пока что Psych-101 ориентирован на западные культуры и не учитывает широкий диапазон индивидуальных характеристик и различий. Предстоит также развитие методов для работы с мультимодальными данными, включающими не только текст, но и визуальные, аудио и другие типы информации. В долгосрочной перспективе использование подхода Центура открывает путь к созданию по-настоящему единой теории когнитивных процессов — комплексной, интегрированной и способной одновременно охватывать множество аспектов человеческой психики.
Эта цель не раз выдвигалась авторами классических трудов по когнитивной науке, и теперь благодаря передовым методам искусственного интеллекта и обширным данным она становится достижимой. Таким образом, Центур представляет собой новый рубеж в изучении человеческого разума, объединяющий в себе возможности масштабного машинного обучения, когнитивной науки и нейронауки. Его развитие и дальнейшее распространение обещают изменить представления о том, как можно изучать и моделировать поведение и мышление человека, а также создают базис для новых прорывов в областях психологии, нейронаук и искусственного интеллекта.