Познание человеческого разума всегда оставалось одной из самых сложных и интригующих задач в науке. Как устроена наша способность принимать решения, учиться и адаптироваться? Что позволяет людям демонстрировать невероятную гибкость и универсальность мышления? Вопреки значительности этих вопросов, до недавнего времени ответы оставались разрозненными и узкоспециализированными. Однако с недавним появлением масштабных моделей, способных охватывать множество когнитивных процессов, появилась возможность сделать шаг к единой теории человеческого мышления. Центур — это новая фундаментальная модель когнитивных процессов, разработанная группой исследователей из разных научных центров мира. В её основе лежит современная большая языковая модель Llama версии 3.
1 с 70 миллиардами параметров, которая была дополнительно обучена на уникальном массиве данных под названием Psych-101. Этот набор включает более десяти миллионов выборов, собранных от более чем 60 тысяч участников в ходе 160 различных психологических экспериментов. Такое масштабное обучение позволило создать инструмент, способный не только предсказывать человеческое поведение, но и имитировать его с поразительной точностью. Главным достоинством Центура является его универсальность. В то время как классические модели когнитивной психологии традиционно привязывались к узким областям — будь то теория перспектив, модели обучения или принятия решений — Центур способен работать в совершенно разных контекстах.
Он демонстрирует устойчивость перед новыми задачами, коренным образом отличающимися от обучающих, например, при изменении сюжета эксперимента или условий его проведения. Это означает, что модель способна адаптироваться к новым, ранее ей неизвестным ситуациям, что является ключевым аспектом человеческого мышления. Принцип работы Центура основывается на так называемом parameter-efficient fine-tuning — эффективном дообучении с использованием техники низкоранговой адаптации QLoRA. Вместо полного перенастроя большого числа параметров, добавляются адаптеры с небольшим количеством настраиваемых параметров, что позволяет сохранить знания базовой языковой модели и комбинировать их с новым опытом, полученным из психологических данных. Такая методика делает процесс тренировки не только более экономным с точки зрения вычислительных ресурсов, но и эффективным в достижении высокой производительности.
Проверка модели на реальных данных показала, что Центур значительно превосходит существующие специализированные когнитивные модели, особенно в предсказании поведения новых участников, не включенных в тренировочный набор. Более того, Центур способен воспроизводить сложные паттерны принятия решений, наблюдаемые у людей, включая разные типы стратегий исследования и обучения — от чисто модельных до гибридных вариантов. Это подтверждает глубину и гибкость его внутреннего представления о когнитивных процессах. Уникальным аспектом Центура является также его соответствие активности человеческого мозга. Анализы функциональной магнитно-резонансной томографии (fMRI), сопоставлявшие внутренние представления модели с нейронной активностью у участников экспериментов, показали высокую корреляцию.
Такой уровень нейроальйинмента — соответствия между моделью и реальной человеческой деятельностью мозга — открывает новые перспективы для изучения состава и организации когнитивных функций. Центур и Psych-101 вместе дают исследователям новый качественный инструмент для научных открытий. Благодаря естественному языковому формату и масштабной информации, они позволяют быстро формулировать гипотезы, тестировать и уточнять модели поведения. В качестве примера был проведён анализ стратегии принятия решений в парадигме с несколькими атрибутами, где с помощью Центура удалось выявить более точную и интерпретируемую модель, чем ранее представленные гипотезы. Перспективы использования Центура выходят далеко за пределы академической науки.
Автоматизация когнитивных исследований, оптимизация дизайна психологических экспериментов, возможность предсказания индивидуальных различий в поведении и даже применение в клинической психиатрии — всё это становится более доступным благодаря такой универсальной модели. Можно представить себе будущее, где эксперимент проводится с помощью искусственного интеллекта, позволяющего экономить время, ресурсы и увеличивать точность результатов. Стоит отметить, что Psych-101 в своём нынешнем виде является крупнейшим и наиболее разнообразным собранием данных из области человеческого поведения, включающим задачи из обучения, принятия решений, памяти и других областей. Тем не менее авторы работы признают, что набор данных пока имеет определённые ограничения, такие как преобладание экспириенсов из западных культур и недостаток информации о индивидуальных особенностях участников. В планах развитие Psych-101 в мультимодальный формат с учётом социальных, психологических и биологических факторов, что ещё больше расширит возможности модели и повысит её применимость в разных областях.
Кроме того, технический прогресс предоставляет возможности для создания новых моделей с разнообразной архитектурой, основанных на данных Psych-101. Это позволит экспериментально проверить гипотезы о том, какой архитектурный дизайн наиболее приближен к человеческому мышлению и каким образом мозг оптимизирует свои функции. Возможно появление гибридных моделей с доменно-специфическими и общими когнитивными модулями, что даст ответы на фундаментальные вопросы о структуре и динамике человеческого разума. Общество науки неоднозначно воспринимало идеи единой модели человеческого мышления. Существовали опасения, что новые подходы могут не быть совместимы с устоявшимися теориями и встретить сопротивление.