Современный мир кибербезопасности постоянно сталкивается с новыми вызовами и угрозами, требующими эффективных и быстрых решений. В этой динамической среде особое внимание привлекаются автономные системы, способные самостоятельно анализировать и обнаруживать уязвимости без постоянного вмешательства человека. Одним из самых интересных новшеств последних лет стал подход, предполагающий создание агентов, построенных на объединении разных языковых моделей — так называемых моделей-сплавов или alloyed agents. Эта концепция зародилась из простого, но новаторского эксперимента, который показал значительный рост эффективности обнаружения уязвимостей и может иметь далеко идущие последствия в области агентных ИИ-технологий и за их пределами. За основу такого подхода взят проект XBOW — автономный пентестер, предназначенный для поиска уязвимостей в веб-приложениях.
Его задача — после первичной настройки полностью самостоятельно проводить тесты, находить дыры в безопасности и предоставлять отчет о средствах устранения. Особенность проекта в том, что агент действует по принципу непрерывного цикла действий: он выполняет определенное действие, получает обратную связь, оценивает ситуацию и принимает решение о следующем шаге. В таких условиях качество решений напрямую зависит от способности агента мыслить стратегически и гибко подстраиваться под результаты предыдущих шагов. Задача, которую решает агент XBOW, схожа с участием в соревнованиях CTF (Capture The Flag), где необходимо последовательно атаковать веб-приложение, чтобы получить доступ к условному флагу — точке уязвимости. Такие задачи часто требуют не просто однотипных повторяющихся действий, а чередования разных подходов и генерации множества идей, что подчеркивает важность многостороннего мышления искусственного интеллекта.
На протяжении одной проверки агенту приходится проследить большое количество «тупиков» и «ложных следов», экспериментировать и, наконец, выйти на решение. Это уникальный пример задачи, где успех зависит не от линейного прогресса, а от способности переключаться между разными стратегиями и комплексно использовать разные типы рассуждений. В качестве основы для интеллектуальной платформы XBOW используются современные языковые модели (LLM) от различных провайдеров. В процессе многократных тестирований специалисты обнаружили, что ни одна из моделей не является универсальной чемпионкой для всех видов задач. Например, GPT-4 хорошо справляется с одними вызовами, а модель Sonnet и Gemini проявляют лучшие результаты на других.
Эта закономерность подтолкнула команду к поиску механизма, позволяющего сочетать сильные стороны разных моделей для максимального результата. Так и родилась идея создания моделей-сплавов — когда в рамках одного и того же рабочего цикла попеременно вызываются разные модели. Суть технологии заключается в том, что агент не ограничивается одним языковым ядром, а включает в диалог поочередно разные модели, например, сначала Sonnet, затем Gemini, снова Sonnet и так далее. При этом каждая из моделей работает с общей историей диалога и воспринимает реплики как свои собственные, несмотря на то, что часть из них была сгенерирована другим ИИ. Такой подход воспроизводит ситуацию, похожую на объединение различных экспертов, каждый из которых вносит уникальный вклад, что существенно расширяет набор интеллектуальных стратегий.
В ходе практических экспериментов с модельными сплавами результаты оказались впечатляющими. На фиксированных наборах тестов общий процент успешного нахождения уязвимостей вырос с 25% до 55%, а в ряде случаев рост доходил и выше. Можно провести аналогию с металлическими сплавами, обладающими лучшими качествами, чем их отдельные компоненты: комбинирование различных моделей приводит к синергетическому эффекту, усиливающему общую производительность. Важно отметить, что не все сочетания моделей дают такие выгоды. Максимальную отдачу дают слияния моделей с принципиально разными подходами и особенностями работы.
Например, комбинация Sonnet 4.0 и Gemini 2.5 показала сильную взаимодополняемость, связанную с их низкой когнитивной корреляцией друг с другом. В то же время сплавы между моделями одной компании, подобными Sonnet 3.7 и Sonnet 4.
0, демонстрируют лишь усредненный эффект без заметного прироста, так как модели слишком схожи по характеру работы. Такая стратегия внесла ясность и по вопросам оптимального баланса в сплавах. Если одна модель явно сильнее другой, то вес должен отдаваться именно ей, иначе низкопроизводительный компонент способен снизить эффективность всей системы. Кроме того, вариантов организации последовательности вызова моделей может быть несколько — их можно чередовать, выбирать случайно или строить на более сложных правилах, учитывающих текущий этап решения задачи. Практическое применение подхода моделирования агентов на основе сплавов далеко не ограничивается кибербезопасностью и пентестингом.
Этот принцип применим в любом контексте, где задача требует широкий спектр идей и подходов, а процесс достижения результата носит итеративный характер. В частности, агентные решения для научных исследований, управления стартапами, автоматизации бизнес-процессов и других направлений могут существенно выиграть от использования таких гибридных ИИ-систем. Однако, как и любая технология, модельные сплавы имеют свои ограничения. Они неэффективны в задачах, где все действия ведут к последовательному и равномерному прогрессу без необходимости в генерации разнородных идей. В таких случаях аритметическое усреднение результатов моделей вряд ли даст бонусы.
Также использование нескольких моделей повышает затраты на вычисления и усложняет кеширование подсказок, что требует взвешенного подхода к экономической стороне проектов. Кроме того, если одна модель эксклюзивно превосходит все остальные в своей нише, ее смешивание с остальными бессмысленно — лучше сосредоточиться именно на ней. Еще одним важным аспектом является управление коммуникацией между сомодельюми. Несмотря на то, что в реализации одновременно поддерживается единый диалог и последовательность ответов, модели попеременно выдают свои предложения, не осознавая явного различия в происхождении выводов. Это создает эффект единого интеллекта с разнообразным внутренним диалогом, который помогает комбинировать креативность и системность мышления.
Сравнительно с другими методами объединения ИИ, такими как многозадачные агенты, голосования или оркестровка разных моделей спорным образом, модельные сплавы дают гораздо более легкий и эффективный интеграционный путь. Это особенно полезно для приложений с большим числом итераций, где нагрузка от множества независимых запросов и принятие решений в одном раунде были бы чрезмерны и нерациональны. Примером успешного внедрения подхода стал рост показателей легкости решения задач, когда модельный сплав, состоящий из Sonnet 4.0 и Gemini 2.5, добивался результата с эффективностью до 68,8%, значительно превзойдя отдельные модели.
Эта тенденция подтверждается интересным феноменом — чем более различны модели в рамках сплава, тем более выражен выигрыша от их объединения. Это вызывает дополнительные перспективы для дальнейшего поиска и адаптации моделей из разных источников и с разной специализацией. Подводя итог, модельные сплавы представляют собой прорывной метод повышения интеллектуальных возможностей автономных агентов ИИ. Объединяя сильные стороны разных языковых моделей, они позволяют достичь более качественных, гибких и надежных решений сложных и разнообразных задач, требующих множества разноплановых инсайтов. Этот подход уже доказал свою эффективность в области кибербезопасности и имеет потенциал для широкого применения в самых разных сферах.
Эксперты считают, что будущее агентного ИИ лежит именно в гибридных системах, плавно объединяющих интеллект разных моделей и подходов. Поэтому разработчикам и исследователям настоятельно рекомендуется внимательно изучить возможности и ограничения моделей-сплавов, экспериментировать с их конфигурациями и использовать их как инструмент для создания действительно мощных и динамичных интеллектуальных сервисов. От инноваций в таких технологиях зависит не только безопасность современных цифровых систем, но и эффективность работы в самых различных областях, где требуется творчество, адаптивность и мультидисциплинарный подход.