Понимание человеческого сознания было и остаётся одной из важнейших задач психологии, нейронауки и искусственного интеллекта. Создание унифицированной теории познания стало давней мечтой учёных, поскольку существующие методы и модели часто ограничены конкретными областями или задачами. Однако недавно появилась инновационная модель, получившая название Centaur — она объединяет огромный массив данных человеческого поведения с современными технологиями обработки естественного языка, что позволяет предсказывать и воспроизводить поведение человека в самых различных ситуациях. Основой для Centaur послужила одна из крупнейших в истории психологии база данных — Psych-101. Этот массив данных содержит результаты свыше 160 психологических экспериментов, более чем на 60 тысячах участников и включает более 10 миллионов отдельных выборов и решений.
Все эти данные были транскрибированы в единый формат естественного языка, что обеспечило универсальность и удобство для обучения модели. Благодаря такой структурированной информации удалось выявить общие закономерности и паттерны поведения, которые и легли в основу новой модели. Centaur основан на больших языковых моделях, технологиях, которые сами по себе известны способностью к генерации и пониманию текста на человеческом уровне. Однако уникальность Centaur заключается в том, что эта языковая модель была дообучена на огромной базе экспериментов, связанных с когнитивными процессами и принятиями решений. Такой подход позволил объединить богатые знания о мире, которые содержат современные языковые модели, с подробными наблюдениями за человеческим поведением.
Проверка эффективности модели Centaur показала её способность превосходить традиционные когнитивные модели во многих задачах. Она не только точнее предсказывает решения ранее невидимых участников, но и устойчиво работает на тестах, где изменена структура задачи или её содержание. К примеру, модель смогла предсказать поведение людей даже в тех экспериментах, которые не были включены в тренировочную выборку, включая ситуации с изменёнными сюжетными рамками или логическими задачами. Особенно впечатляет способность Centaur к генерации поведения в открытой форме, когда она сама выстраивает серию решений, не опираясь на внешние подсказки. В таких условиях модель демонстрирует, что её принятия решений соответствуют распределениям, наблюдаемым у реальных людей — с вариациями между модельными и немодельными типами обучения, различными стратегиями исследования и исследованиями неопределённости.
Такой уровень реализма трудно добиться традиционными подходами, которые чаще всего сосредоточены на усреднённых паттернах. Важной особенностью Centaur является то, что её внутренние представления стали ближе к человеческой нейронной активности, хотя она специально не обучалась на данные мозговых исследований. Анализы с использованием фотоснимков активности мозга при выполнении когнитивных задач показали, что представления модели лучше предсказывают нейронные отклики людей по сравнению с базовой языковой моделью без дополнительного обучения. Это открытие укрепляет идею о том, что крупномасштабное обучение на поведенческих данных способствует развитию моделей, которые не только имитируют, но и отражают настоящие нейробиологические процессы. Centaur также стал мощным инструментом для научных открытий.
На примере исследования многокритериальных решений модель помогла выявить эффективные стратегии выбора, комбинируя простые эвристики, что в итоге превзошло изначальные гипотезы исследователей. Такой подход позволяет использовать модели не только для прогнозов, но и для формулировки новых теорий и конструирования более интерпретируемых моделей поведения. Ещё одно значимое преимущество Centaur заключается в его архитектурной гибкости. Модель была построена на основе Llama 3.1 70B — современного языкового ядра, обученного компанией Meta AI, с использованием технологии низкоранговой адаптации, позволяющей эффективно настраивать лишь малую часть параметров без ущерба для производительности.
Такой метод обеспечивает быстрое обучение, оставляя основной объём знаний неизменным, и позволяет сфокусироваться на особенностях человеческого поведения. Разработка Psych-101 была выполнена с особым вниманием к качеству и универсальности. Были тщательно отобраны эксперименты, имеющие открытые и подробные данные, покрывающие широкий спектр когнитивных областей: принятие решений, обучение, память, игры с многорукими бандитами, логические рассуждения и многое другое. Все данные были представлены в естественном языке, что позволило адаптировать модель к пониманию самых разных ситуаций и заданий. Исследователи также выявили потенциал Centaur в прогнозировании нематериальных аспектов поведения, таких как время ответа человека, которое коррелирует с неопределённостью в принятых решениях.
Это подчёркивает глубокую связь модели с когнитивными процессами и её способность моделировать не только выбор, но и динамику мышления. Несмотря на свои возможности, Centaur пока имеет определённые ограничения. Текущая версия содержит данные преимущественно из западных культур и образовательных групп, так называемого WEIRD-популяции. В будущем планируется расширение набора данных за счёт включения других культурных, психолингвистических и социальных доменов, что позволит повысить универсальность модели и понимание индивидуальных различий в когнитивных процессах. Также перспективным направлением является создание новых архитектурных подходов, основанных на таком огромном корпусе данных, что позволит проверить различные гипотезы об организации человеческого разума.
Например, исследовать эффективность трансформерных архитектур по сравнению с векторными форматами памяти или интегрировать нейробиологические теории в вычислительные модели. Centaur открывает широкие возможности для автоматизации научного процесса в когнитивных науках, предоставляя платформу для ин-силико моделирования, оптимизации экспериментов и разработки новых теорий на основе данных. Модель позволяет учёным быстро тестировать гипотезы, предсказывать поведение участков мозга и оформлять результаты в интерпретируемые когнитивные стратегии. Таким образом, Centaur представляет собой важный шаг к созданию единой фундаментальной модели человеческого сознания, способной обобщать знания и наблюдения по самым разным когнитивным сферам. С интеграцией современных языковых технологий и богатых поведенческих данных он помогает раскрывать сложные механизмы мышления и принимать решения, а также создаёт мост между экспериментальной психологией, нейробиологией и искусственным интеллектом.
Эта инновационная разработка обещает в будущем трансформировать наше представление о человеческом разуме, приводя к появлению более точных и комплексных когнитивных теорий и улучшая взаимодействие человека и машины. Центур — не просто модель, это платформа для глубокого понимания себя и расширения границ познания.