Познание человека — одна из самых сложных загадок современной науки. Наша способность принимать решения, учиться на опыте, делать выборы и адаптироваться к новому окружению определяет наше существование и развитие. Несмотря на глубокие знания, накопленные психологией и когнитивными науками, до сих пор не удалось создать единый, всеобъемлющий теоретический каркас, объясняющий человеческое поведение во всех сферах. Новые технологические достижения и большие объемы данных создали уникальные условия для прорыва в понимании когнитивных процессов. Проект Центур (Centaur) — это фундаментальная модель, которая способна не только предсказывать, но и воспроизводить человеческое поведение в самых различных экспериментальных ситуациях.
Она создана на основе передовых языковых моделей искусственного интеллекта и обучена на крупнейшем из когда-либо собранных массивов данных о поведении человека, известном как Psych-101. Проблема ограничения доменом и интеграция знаний Сегодняшние модели в психологии и когнитивных науках нередко сфокусированы на определенных специфических задачах или областях. Они отлично справляются с поставленными задачами, будь то изучение памяти, принятия решений или обучения, но не способны мостить знания и методы в единую универсальную систему понимания. Подобно тому, как ИИ-модели для игры в го превосходны в этой игре, но бесполезны за её пределами, доменно-специфические модели когнитивных процессов ограничены в своей области применения. Учёные давно высказывали идею создания единой теории познания, которая не просто объединит уже известные факты, а будет способна прогнозировать поведение человека в любых условиях.
Однако для этого требовалась модель, достаточно универсальная, чтобы обрабатывать разнообразную информацию и масштабно обучаться на больших данных. В итоге получилась идея фундаментальной модели — базы, на которой можно строить дальнейшие исследования и разработки. Psych-101: крупнейший набор данных поведения людей Для построения Центура были собраны уникальные данные — Psych-101. Этот масштабный корпус содержит результаты более 160 психологических экспериментов, данных от более 60 тысяч участников, с суммарно свыше 10 миллионов индивидуальных выборов. При этом эксперименты охватывают широчайший спектр когнитивных задач: от принятия решений и обучения с подкреплением до сложных сценариев памяти и причинно-следственного мышления.
Важной особенностью Psych-101 является описание каждого эксперимента и взаимодействия участников в естественном, понятном языковом формате. Это позволило создать общее представление для самых разнообразных исследований и оптимизировать обучение модели. Centaur — синтез искусственного интеллекта и когнитивной науки Centaur построен на основе одной из самых современных языковых моделей — Llama 3.1 70B, разработанной компанией Meta AI. Основой послужила архитектура трансформеров, позволяющая эффективно обрабатывать контекст и извлекать сложные структуры из текстовых данных.
Чтобы адаптировать модель к задачи предсказания человеческого поведения, учёные применили метод оптимизации под названием QLoRA (Quantized Low-Rank Adaptation), который позволяет дообучать лишь малую часть параметров, вводя низкоранговые адаптеры, сохраняя при этом базовую структуру неизменной. Такая технология обеспечивает эффективное обучение на большом наборе данных, при этом позволяет не потерять богатства предобученного языкового ядра. В результате fine-tuning на Psych-101 модель Centaur смогла научиться предсказывать и генерировать поведение человека, демонстрируя высокую точность на экспериментах, не включённых в обучающий набор. Это важная черта, свидетельствующая о способности модели к генерализации, выходящей за рамки обученной выборки и охватывающей новые и незнакомые задачи. Высокая точность и универсальность модели Centaur продемонстрировал превосходство над существующими когнитивными моделями и базовой языковой моделью Llama не только в области точности предсказания, но и в способности восстанавливать распределение поведенческих траекторий на уровне целой популяции.
В рамках задач, где проверялась степень использования направленного исследования и обучаемости, модель проявила характеристики, очень близкие к реальному поведению людей. Более того, она успешно отличала человеческие ответы от искусственных стратегий, что подтверждает её ориентированность именно на человеческое поведение. Гибкость применительно к новым экспериментам была дополнительно проверена в ряде ситуаций с изменёнными условиями, структурными модификациями и даже полностью новыми доменами. Например, модель смогла успешно обрабатывать эксперимент с изменённой легендой (cover story) и трехвариантной задачей выбора, которые ранее не встречались в базовом корпусе. Эта способность объясняется тем, что модель обучена работать с естественным языком, способным описывать произвольные условия, что резко расширяет её потенциал за рамками фиксированных когнитивных парадигм.
Взаимосвязь с нейронной активностью человека Интересным итогом fine-tuning Центура стало также повышение соответствия его внутренних представлений реальным данным нейронаучных измерений. Анализ результатов функциональной магнитно-резонансной томографии (fMRI) участников, выполнявших когнитивные задачи вне тренировочной выборки модели, показал, что прогнозы активности по Centaur превосходят базовую языковую модель и многие традиционные когнитивные модели. Это важное свидетельство того, что модель не только имитирует поведение, но и отражает фундаментальные механизмы обработки информации в человеческом мозге. Применение в научных исследованиях и будущее когнитивной науки Centaur и Psych-101 открывают принципиально новые возможности для когнитивных исследований. Модель можно использовать как инструмент для быстрой оценки гипотез, проектирования экспериментов и формирования новых теорий.
В частности, методика научного минимизирования сожалений (Scientific Regret Minimization), использующая Centaur в качестве эталонного предсказателя, позволяет выявлять пробелы в существующих моделях и формулировать более точные гипотезы о решениях человека. Создание интерпретируемых когнитивных моделей, сопоставимых по точности с Centaur, при этом сохраняя их объяснительную силу, стало возможным благодаря взаимодействию с языковой моделью. Такой подход сокращает классический цикл гипотеза-эксперимент-вывод и открывает перспективы создания единой теории человеческого познания, основанной на масштабных данных и мощных вычислительных моделях. Помимо непосредственной аналитики, Centaur может стать основой для «виртуальных участников» в когнитивных экспериментах, что значительно ускорит исследовательские процессы. Аналоги этой модели, но с меньшим числом параметров, например Minitaur, уже доступны для прототипирования, позволяя широкому кругу исследователей использовать современные технологии даже без специализированного оборудования.
Вызовы и перспективы дальнейших исследований Несмотря на успехи, модель не лишена ограничений. Psych-101 в текущем виде преимущественно представлен данными из областей обучения и принятия решений, с небольшим охватом социальных, лингвистических и индивидуальных различий. Ведётся работа по расширению корпуса, включая разнообразные области психологических исследований, культурные и демографические аспекты, что позволит создавать более всеобъемлющие и репрезентативные модели. Также необходимо развивать формат хранения и обработки данных, который бы не ограничивался лишь текстовым описанием, а включал мультимодальные данные — видео, аудио, физиологические измерения и др. Такой подход позволит повысить точность и реалистичность моделей человеческого поведения и мышления.
Важной перспективой остаётся глубокий анализ внутренних механизмов модели Centaur. Методы интерпретации, включая визуализацию внимания и разреженных представлений, помогут лучше понять, как именно формируются когнитивные стратегии, и как информация представляется и обрабатывается на различных уровнях модели. Эти знания могут стать предпосылкой для синтеза новых нейронаучных и психологических теорий. Заключение Создание Centaur — фундаментальной модели, способной предсказывать и воспроизводить человеческое поведение в самых различных когнитивных задачах, представляет собой ключевой шаг на пути к формированию единой теории человеческого познания. Использование масштабных наборов данных, передовых методов обучения и интеграция знаний из психологии, нейронауки и искусственного интеллекта революционизирует возможности исследования человеческого разума.
Этот проект не только подтверждает перспективность интегративного подхода, но и открывает широкие горизонты для будущих исследований и практических приложений в образовании, медицине, интерфейсах человек-компьютер и многих других областях. Centaur становится не просто моделью — он символизирует объединение усилий науки и технологии в стремлении понять самые загадочные и фундаментальные процессы нашего сознания.