Познание человеческого сознания издревле является одной из самых сложных и интригующих задач науки. В попытках понять, как человек принимает решения, учится и взаимодействует с окружающим миром, исследователи создавали разнообразные когнитивные теории, каждая из которых охватывала лишь определенный спектр поведения и процессов. Однако сегодняшний научный прогресс, подкрепленный развитием искусственного интеллекта и больших языковых моделей, открыл невиданные ранее возможности для построения универсальной модели, способной имитировать и предсказывать человеческое поведение в самых разных ситуациях. Одним из таких прорывов стала модель под названием Центур – инновационная фундаментальная модель, сформированная путем глубокого обучения на базе огромного объема психологических экспериментов. Ее создание знаменует собой важнейшее событие в области когнитивной науки и машинного обучения.
В основе разработки Центура лежит объединение многолетних психологических исследований и современных достижений в области обработки естественного языка. Для обучения модели использовался объемный набор данных Psych-101, включающий более 10 миллионов выборов человека, собранных от свыше 60 тысяч участников в рамках 160 различных экспериментов. Каждый эксперимент был описан в естественном языке, что позволило модели воспринимать широкий спектр когнитивных задач в едином формате. Такой подход устранил прежние ограничения, когда традиционные когнитивные модели были очень узко специализированы и не могли адекватно адаптироваться к новым ситуациям или дополнять друг друга. Центур построен на базе современного крупного языкового трансформера Llama 3.
1 70B, разработанного компанией Meta AI, и обучен с применением технологии низкоранговой адаптации (QLoRA). Данный метод позволил эффективно адаптировать модель к задаче предсказания человеческого поведения, сохраняя глубокое понимание языка, накопленное в исходной версии. В процессе обучения особое внимание уделялось тому, чтобы модель фокусировалась исключительно на воспроизведении ответов участников экспериментов, игнорируя служебные тексты или инструкции, что повысило качество и точность прогнозов. Одним из ключевых преимуществ Центура стала его способность превосходить существующие доменно-специфичные когнитивные модели в очень широком спектре задач. Исследования показали, что модель успешно предсказывает поведение новых участников, которые не участвовали в обучающей выборке, а также демонстрирует уникальную устойчивость к изменениям контекста, таких как изменение условных историй задач или модификация структуры экспериментов.
Это свидетельствует о глубоком понимании универсальных паттернов человеческого мышления и выдающейся способности к обобщению. Кроме того, Центур способен моделировать человеческое поведение в открытом режиме, когда результаты его собственных выборов используются для получения последующих ответов, что можно рассматривать как самый жесткий тест реалистичности. В различных проверках, например, на задаче с несколькими вариантами выбора и исследованием стратегий исследования и эксплуатации, модель демонстрировала поведение, статистически сопоставимое с реальными данными участников. Центур не только воспроизводит среднее поведение, но и с точностью отражает разнообразие стратегий, характерных для реального населения людей, что еще более сильно выделяет его среди прочих моделей. Выход за пределы обучающих данных стал важным вехой в оценке модели.
Центур успешно справляется с предсказанием человеческого выбора в областях, которые не были представлены в обучающем наборе. Примером служат задачи с измененной тематикой, где модель сохраняет высокую точность и предсказательную мощь. Изменение числа вариантов выбора также не угрожает стабильности прогнозов, а в совершенно новых областях, таких как формальная логика и рассуждения, модель продолжает демонстрировать глубокое понимание, хотя формальных данных подобной тематики не было внесено в тренировочный пул. Особое значение представляет обнаружение корреляций между внутренними представлениями Центура и реальной нейроактивностью человека. Сравнительный анализ показал, что представления модели тесно связаны с показателями, регистрируемыми при помощи функциональной магнитно-резонансной томографии (фМРТ), что является указателем не только на внешнее поведение, но и на внутреннюю когнитивную близость.
Это открывает перспективы использования таких моделей для более глубокого изучения мозговых процессов и разработки моделей, интегрирующих поведенческие и нейрофизиологические данные. Применение модели не ограничивается только описанием и предсказанием поведения. Центур стал мощным инструментом в процессе научного открытия и разработки новых когнитивных теорий. В одном из примеров он использовался для создания формализованной модели, объясняющей поведение в многокритериальном выборе, выявляя новые закономерности в принятии решений, которые ранее оставались незамеченными. Использование методов «научного минимизма сожаления» позволило оптимизировать модели на основе предсказаний Центура, добиваясь максимального соответствия человеческому поведению при сохранении интерпретируемости и прозрачности.
Такой симбиоз мощного предсказательного инструмента и привычных когнитивных моделей способствует значительному продвижению в построении единой теории познания. Преимущества разработки не исчерпываются интеграцией богатого объема данных и универсальностью. Благодаря параметрической эффективности метода обучения QLoRA модель осталась вычислительно доступной, что позволяет исследователям оперативно использовать ее в разнообразных экспериментах и прототипах. Это открывает дорогу к масштабной автоматизации когнитивных экспериментов, экономии ресурсов и ускорению научного прогресса. Однако важным аспектом при формировании такой широкой модели является вопрос разнообразия и репрезентативности данных.
В текущей версии Psych-101 наблюдается определенная склонность к данным из определенных культурных и демографических групп (так называемый WEIRD-базис – западные, образованные, индустриальные, богатые и демократичные общества). Планируется расширение и обогащение обучающего материала за счет включения данных из других дисциплин, таких как психолингвистика, социальная психология и экономика, а также учитывать индивидуальные различия, возраст и культурные особенности, что позволит модели действительно стать глобальной и многофункциональной основой изучения человеческого сознания. Переход к многоформатным данным — следующая значимая задача, так как не вся экспериментальная информация может быть адекватно передана в текстовом формате. Интеграция мультимодальных данных, включая визуальные, аудиальные или физиологические сигналы, станет важным шагом в более глубоком и полномасштабном понимании когнитивных процессов. Центур и Psych-101 свидетельствуют об успешной реализации идеи объединения данных и вычислительных ресурсов для построения универсальной модели человеческого познания.
Они подчеркивают потенциал искусственного интеллекта не только как инструмента автоматизации, но и как партнера в научном конструкте, который может направлять, уточнять и расширять наши знания о сложных когнитивных механизмах. Взгляд в будущее связан с дальнейшей разработкой более мощных архитектур, способных интегрировать как доменно-специфические, так и доменно-универсальные компоненты. Это позволит исследовать взаимодействие между различными когнитивными модулями и станет базисом для целостной теории мозга и сознания. Одновременно предполагается углубленное изучение внутренних репрезентаций модели, что даст ключ к пониманию того, как именно знание хранится, обрабатывается и трансформируется в процессе мышления. Сегодня Центур уже демонстрирует лидерские позиции в когнитивных испытаниях, превосходя множество специализированных моделей и выступая гарантией будущих прорывов.
Его успех – это свидетельство того, что будущее когнитивной науки тесно связано с развитием и применением фундаментальных моделей, способных охватить всю сложность человеческого поведения, раскрыть суть мышления и воспроизвести его на новых платформах. Путь к единой теории сознания, некогда казавшийся недостижимым и слишком амбициозным, становится все ближе, а такие технологии ведут нас к пониманию ума, столь же масштабному, сколь и вдохновляющему.