Интервью с лидерами отрасли Стартапы и венчурный капитал

Агенты на основе моделей-сплавов: как объединение ИИ повышает эффективность кибербезопасности

Интервью с лидерами отрасли Стартапы и венчурный капитал
Agents Built from Alloys

Погружение в инновационный подход создания агентных систем ИИ на основе комбинирования разных языковых моделей, который значительно улучшает результаты автономных решений в области кибербезопасности и не только.

Современный мир кибербезопасности постоянно сталкивается с новыми вызовами и угрозами, требующими эффективных и быстрых решений. В этой динамической среде особое внимание привлекаются автономные системы, способные самостоятельно анализировать и обнаруживать уязвимости без постоянного вмешательства человека. Одним из самых интересных новшеств последних лет стал подход, предполагающий создание агентов, построенных на объединении разных языковых моделей — так называемых моделей-сплавов или alloyed agents. Эта концепция зародилась из простого, но новаторского эксперимента, который показал значительный рост эффективности обнаружения уязвимостей и может иметь далеко идущие последствия в области агентных ИИ-технологий и за их пределами. За основу такого подхода взят проект XBOW — автономный пентестер, предназначенный для поиска уязвимостей в веб-приложениях.

Его задача — после первичной настройки полностью самостоятельно проводить тесты, находить дыры в безопасности и предоставлять отчет о средствах устранения. Особенность проекта в том, что агент действует по принципу непрерывного цикла действий: он выполняет определенное действие, получает обратную связь, оценивает ситуацию и принимает решение о следующем шаге. В таких условиях качество решений напрямую зависит от способности агента мыслить стратегически и гибко подстраиваться под результаты предыдущих шагов. Задача, которую решает агент XBOW, схожа с участием в соревнованиях CTF (Capture The Flag), где необходимо последовательно атаковать веб-приложение, чтобы получить доступ к условному флагу — точке уязвимости. Такие задачи часто требуют не просто однотипных повторяющихся действий, а чередования разных подходов и генерации множества идей, что подчеркивает важность многостороннего мышления искусственного интеллекта.

На протяжении одной проверки агенту приходится проследить большое количество «тупиков» и «ложных следов», экспериментировать и, наконец, выйти на решение. Это уникальный пример задачи, где успех зависит не от линейного прогресса, а от способности переключаться между разными стратегиями и комплексно использовать разные типы рассуждений. В качестве основы для интеллектуальной платформы XBOW используются современные языковые модели (LLM) от различных провайдеров. В процессе многократных тестирований специалисты обнаружили, что ни одна из моделей не является универсальной чемпионкой для всех видов задач. Например, GPT-4 хорошо справляется с одними вызовами, а модель Sonnet и Gemini проявляют лучшие результаты на других.

Эта закономерность подтолкнула команду к поиску механизма, позволяющего сочетать сильные стороны разных моделей для максимального результата. Так и родилась идея создания моделей-сплавов — когда в рамках одного и того же рабочего цикла попеременно вызываются разные модели. Суть технологии заключается в том, что агент не ограничивается одним языковым ядром, а включает в диалог поочередно разные модели, например, сначала Sonnet, затем Gemini, снова Sonnet и так далее. При этом каждая из моделей работает с общей историей диалога и воспринимает реплики как свои собственные, несмотря на то, что часть из них была сгенерирована другим ИИ. Такой подход воспроизводит ситуацию, похожую на объединение различных экспертов, каждый из которых вносит уникальный вклад, что существенно расширяет набор интеллектуальных стратегий.

В ходе практических экспериментов с модельными сплавами результаты оказались впечатляющими. На фиксированных наборах тестов общий процент успешного нахождения уязвимостей вырос с 25% до 55%, а в ряде случаев рост доходил и выше. Можно провести аналогию с металлическими сплавами, обладающими лучшими качествами, чем их отдельные компоненты: комбинирование различных моделей приводит к синергетическому эффекту, усиливающему общую производительность. Важно отметить, что не все сочетания моделей дают такие выгоды. Максимальную отдачу дают слияния моделей с принципиально разными подходами и особенностями работы.

Например, комбинация Sonnet 4.0 и Gemini 2.5 показала сильную взаимодополняемость, связанную с их низкой когнитивной корреляцией друг с другом. В то же время сплавы между моделями одной компании, подобными Sonnet 3.7 и Sonnet 4.

0, демонстрируют лишь усредненный эффект без заметного прироста, так как модели слишком схожи по характеру работы. Такая стратегия внесла ясность и по вопросам оптимального баланса в сплавах. Если одна модель явно сильнее другой, то вес должен отдаваться именно ей, иначе низкопроизводительный компонент способен снизить эффективность всей системы. Кроме того, вариантов организации последовательности вызова моделей может быть несколько — их можно чередовать, выбирать случайно или строить на более сложных правилах, учитывающих текущий этап решения задачи. Практическое применение подхода моделирования агентов на основе сплавов далеко не ограничивается кибербезопасностью и пентестингом.

Этот принцип применим в любом контексте, где задача требует широкий спектр идей и подходов, а процесс достижения результата носит итеративный характер. В частности, агентные решения для научных исследований, управления стартапами, автоматизации бизнес-процессов и других направлений могут существенно выиграть от использования таких гибридных ИИ-систем. Однако, как и любая технология, модельные сплавы имеют свои ограничения. Они неэффективны в задачах, где все действия ведут к последовательному и равномерному прогрессу без необходимости в генерации разнородных идей. В таких случаях аритметическое усреднение результатов моделей вряд ли даст бонусы.

Также использование нескольких моделей повышает затраты на вычисления и усложняет кеширование подсказок, что требует взвешенного подхода к экономической стороне проектов. Кроме того, если одна модель эксклюзивно превосходит все остальные в своей нише, ее смешивание с остальными бессмысленно — лучше сосредоточиться именно на ней. Еще одним важным аспектом является управление коммуникацией между сомодельюми. Несмотря на то, что в реализации одновременно поддерживается единый диалог и последовательность ответов, модели попеременно выдают свои предложения, не осознавая явного различия в происхождении выводов. Это создает эффект единого интеллекта с разнообразным внутренним диалогом, который помогает комбинировать креативность и системность мышления.

Сравнительно с другими методами объединения ИИ, такими как многозадачные агенты, голосования или оркестровка разных моделей спорным образом, модельные сплавы дают гораздо более легкий и эффективный интеграционный путь. Это особенно полезно для приложений с большим числом итераций, где нагрузка от множества независимых запросов и принятие решений в одном раунде были бы чрезмерны и нерациональны. Примером успешного внедрения подхода стал рост показателей легкости решения задач, когда модельный сплав, состоящий из Sonnet 4.0 и Gemini 2.5, добивался результата с эффективностью до 68,8%, значительно превзойдя отдельные модели.

Эта тенденция подтверждается интересным феноменом — чем более различны модели в рамках сплава, тем более выражен выигрыша от их объединения. Это вызывает дополнительные перспективы для дальнейшего поиска и адаптации моделей из разных источников и с разной специализацией. Подводя итог, модельные сплавы представляют собой прорывной метод повышения интеллектуальных возможностей автономных агентов ИИ. Объединяя сильные стороны разных языковых моделей, они позволяют достичь более качественных, гибких и надежных решений сложных и разнообразных задач, требующих множества разноплановых инсайтов. Этот подход уже доказал свою эффективность в области кибербезопасности и имеет потенциал для широкого применения в самых разных сферах.

Эксперты считают, что будущее агентного ИИ лежит именно в гибридных системах, плавно объединяющих интеллект разных моделей и подходов. Поэтому разработчикам и исследователям настоятельно рекомендуется внимательно изучить возможности и ограничения моделей-сплавов, экспериментировать с их конфигурациями и использовать их как инструмент для создания действительно мощных и динамичных интеллектуальных сервисов. От инноваций в таких технологиях зависит не только безопасность современных цифровых систем, но и эффективность работы в самых различных областях, где требуется творчество, адаптивность и мультидисциплинарный подход.

Автоматическая торговля на криптовалютных биржах Покупайте и продавайте криптовалюты по лучшим курсам Privatejetfinder.com (RU)

Далее
Heart from organ donor restarted outside the body – offers new source of organs
Воскресенье, 26 Октябрь 2025 Перезапуск сердца вне тела: революция в трансплантологии и новая надежда для больных

Современные методы возрождения сердца вне организма донора открывают уникальные возможности для увеличения числа доступных органов для трансплантации, предлагая новые пути развития медицины и трансформации трансплантологии в будущем.

Woody Allen to publish his first novel
Воскресенье, 26 Октябрь 2025 Вуди Аллен представит свой первый роман: литературный дебют великого режиссера

Известный своими фильмами и эссе, Вуди Аллен готов удивить поклонников своим литературным дебютом – романом «Что с Баумом. », который рассказывает о непростой судьбе среднего возраста и внутренней борьбе главного героя.

Show HN: Conductor, a Mac app that lets you run a bunch of Claude Codes at once
Воскресенье, 26 Октябрь 2025 Conductor для Mac: революция в параллельной работе с Claude Code

Conductor — инновационное приложение для Mac, позволяющее одновременно запускать множество агентов Claude Code в изолированных рабочих пространствах. Это мощный инструмент для разработчиков и команд, стремящихся повысить продуктивность и упростить управление кодом с помощью удобного интерфейса и интеграции с git worktree.

Amazon's AWS cloud computing unit cuts jobs
Воскресенье, 26 Октябрь 2025 Amazon AWS сокращает кадровый состав: что стоит за массовыми увольнениями в облачном гиганте

Amazon Web Services объявляет о сокращении сотен рабочих мест на фоне внедрения искусственного интеллекта и оптимизации бизнеса. Анализ причин и последствий кадровых изменений в крупнейшем облачном подразделении Amazon.

Show HN: Stibbly – Amazon Product Change Tracking
Воскресенье, 26 Октябрь 2025 Stibbly – инновационный инструмент для отслеживания изменений продуктов на Amazon

Обзор сервиса Stibbly, который помогает продавцам и агентствам автоматизировать мониторинг изменений на страницах продуктов Amazon для повышения конкурентных преимуществ и эффективности работы.

Palantir Hits New High Ahead Of Q2 Earnings Report
Воскресенье, 26 Октябрь 2025 Palantir достиг новых высот на фоне ожиданий второго квартального отчёта

Palantir Technologies продемонстрировала впечатляющий рост акций в 2025 году, достигнув рекордных значений накануне публикации финансовых результатов за второй квартал. Инвесторы и аналитики внимательно следят за развитием компании, прогнозируя значительный рост прибыли и выручки.

Exclusive-Bank of England scrutinizes lenders for dollar risk amid Trump worries, sources say
Воскресенье, 26 Октябрь 2025 Банк Англии усиливает контроль за долларовыми рисками банков на фоне неопределённости политического курса США

Банк Англии проводит строгие проверки финансовых учреждений на предмет их устойчивости к долларовым рискам, вызванным изменениями в политике США, что отражает рост озабоченности европейских регуляторов относительно зависимости от доллара в международной финансовой системе.