Создание общих интеллектуальных агентов, способных решать широкий спектр задач и адаптироваться к различным условиям, является одной из главных целей современной науки о искусственном интеллекте. Понятие общего искусственного интеллекта (ОИИ), или AGI (Artificial General Intelligence), привлекает внимание исследователей, предпринимателей и законодателей со всего мира. Несмотря на ошеломляющие успехи в области языковых моделей и машинного обучения, путь к созданию действительно универсального и интеллектуального агента всё ещё проложен множеством вызовов и нерешённых задач. Чтобы понять, какие ещё возможности необходимо развить и какие прорывы произойдут в ближайшем будущем, важен глубокий анализ текущего состояния и осознание перспектив развития. Сегодняшние модели, такие как GPT-4, являются впечатляющими по масштабам и разнообразию знаний, однако они скорее напоминают огромных хранителей информации, нежели реально общих интеллектуальных агентов.
Основной их успех заключается в способности обрабатывать и генерировать текст на основе колоссальных объемов данных, доступных в интернете и других источниках. Эта эволюция привела к сильному увеличению общего «знания» моделей, что проявляется в высоких результатах по различным тестам, например, по MMLU — комплексному экзамену, охватывающему дисциплины от STEM до гуманитарных наук. Однако большие запасы знаний и умение их быстро извлекать — это только начало, и чтобы продвинуться к настоящей общности и интеллекту, требуется развитие дополнительных важнейших свойств. Ключевыми характеристиками, которые выделяют общих интеллектуальных агентов, принято считать общность (generalitet), интеллигентность и агентность. Общность подразумевает возможность эффективно решать задачи во множестве областей и сред.
Интеллигентность — это способность учиться новым навыкам и адаптироваться на основе ограниченного числа примеров. Агентность говорит о возможности планировать и реализовывать цепочки действий, часто длительные и комплексные. Современные языковые модели достигают заметного прогресса лишь в области знаний и базового интеллекта, однако по части агентности им ещё многое предстоит освоить. Одной из ключевых способностей, на которые стоит обратить внимание, является разумение и рассуждение — как алгоритмическое, так и байесовское. Раньше модели недостаточно справлялись с задачами, требующими пошагового логического вывода, сложных вычислений и программирования, что вызвало сомнения в их уровне понимания и интеллекта.
Причина этом — гораздо более высокая сложность и вариативность рассуждений в сравнении с простой подстановкой знаний. Из-за экспоненциального роста количества вариантов решения тех же задач простое обучение на больших статьях недостаточно эффективно, и тут на помощь приходит обучение с подкреплением (reinforcement learning). Это радикально меняет подход к обучению моделей, позволяя им самостоятельно пробовать разные варианты действий и учиться на ошибках через автоматическую проверку результата. Однако рассуждение выходит далеко за рамки математики и кода. В реальной жизни люди сталкиваются с задачами принятия решений, связанными с неопределённостью и субъективными предпочтениями, где нет однозначного ответа.
Речь идёт о тех решениях, которые требуют учёта вероятностных оценок, обновления убеждений в ходе новых наблюдений и взаимодействий — то, что можно назвать байесовским рассуждением. Оно особенно важно для построения умных помощников, которые могли бы прогнозировать события с вероятностной уверенностью и корректно обновлять свои оценки по мере появления новых данных, например, делая точные прогнозы на выборах или в экономике. К несчастью, стандартизированные тесты на такие способности пока практически отсутствуют, поскольку создание таких наборов задач с чётко измеряемыми выходами является нетривиальной и ещё открытой сферой. Важной частью повышения интеллектуальности агентов становится и их способность к активному поиску информации. Человек не ограничивается тем, что знает на данный момент, он часто задаёт дополнительные вопросы и исследует окружающую среду, чтобы получить новые сведения, необходимые для принятия лучших решений.
Большинство современных моделей пока довольно пассивны — они отвечают на вопросы в рамках своей памяти или контекста. Однако для настоящих общих агентов крайне важно уметь определять пробелы в своих знаниях и активно устранять их путём обращения к внешним источникам данных, постановки уточняющих вопросов или выполнения реальных экспериментов. Пока что в этой области наблюдаются лишь отдалённые прототипы и эксперименты, и необходимы новые методики обучения и оценки информации для эффективного развития этой способности. Следующий важнейший этап — умение применять инструменты, рассматриваемые как расширение собственных возможностей. К инструментам относят любые внешние сервисы, базы данных, программы и даже другие модели искусственного интеллекта, к которым агент может обращаться.
Это помогает существенно повысить надёжность и эффективность, избавляя агента от необходимости всякий раз пытаться «запомнить» или «вычислить» всё самостоятельно. Вместо того, чтобы использовать внутренние веса нейросети для хранения всех необходимых функций, разумнее и надёжнее делегировать выполнение специфических задач специально предназначенным для этого программам и базам. Тренировка навыка использования инструментов требует создания обучающих сред, где агенты учатся не только применять известные инструменты, но и создавать свои собственные, что впоследствии позволит им расширять функционал без постоянного прямого вмешательства человека. Проблема долговременных действий и длительных горизонтов планирования также является одним из краеугольных камней на пути к созданию действительно эффективных общих агентов. На практике для реализации сложных проектов и планов требуется последовательное выполнение тысяч и миллионов операций, где накапливающиеся ошибки могут уничтожить всю работу.
Современные модели ограничены максимальной длиной контекста и не всегда способны корректно поддерживать связность и логику на протяжении больших временных промежутков. Решением могут стать механизмы долговременной памяти, интегрированные в архитектуру, которые позволят моделям создавать абстрактные, иерархические заметки и базы знаний, а также систематически рефлексировать над ранее выполненными действиями, устраняя ошибки путём отката и исправлений. Пока подобных систем нет в коммерческом виде, но исследователи активно работают в этом направлении. Кроме того, для решения задач с очень большим количеством этапов и действий может потребоваться распределение вычислительных ресурсов между множеством специализированных агентов — идея мультиагентных систем. Подобные системы позволят разделить сложное задание на множество простых, параллельно выполняемых задач.
При этом такие агенты смогут комбинировать свои решения для достижения общей цели. Эта концепция напоминает специализацию труда в человеческих обществах, но при этом внедряется по-другому из-за особенностей цифровых систем. Мультиагентные архитектуры уже демонстрируют потенциал при исследовательских и поисковых задачах, где нужно просматривать сотни источников, и по мере развития станут одним из важнейших инструментов в арсенале ИИ. Заключая, можно сказать, что создание общих интеллектуальных агентов — это не просто вопрос увеличения объёмов данных и параметров моделей. За этим стоит сложный набор достижений в различных областях: улучшенное рассуждение, активный поиск информации, умелое использование инструментов, долговременное планирование и координация множества агентов.
Каждый из этих компонентов большого пазла требует значительных научных и инженерных усилий. Понимание того, какие именно способности нужны и как их синтезировать, поможет лучше направить ресурсы исследований и подготовиться к трансформации, которую принесёт появление таких систем. В итоге именно такие агенты смогут успешно адаптироваться, обучаться и творить в самых разнообразных условиях, приближая нас к долгожданной цели искусственного интеллекта, способного мыслить и действовать «как человек» и даже превосходить его в ряде задач.