Анализ крипторынка

Почему браузеры не подходят для эффективного взаимодействия ИИ-агентов с интернетом

Анализ крипторынка
The Bear Case on Browser Use

Обзор основных проблем использования браузеров для действий искусственного интеллекта и перспектив развития более эффективных агентных интерфейсов, оптимизированных для машинного взаимодействия с цифровыми сервисами. .

В современном мире развитие искусственного интеллекта стремительно меняет представление о том, как мы взаимодействуем с цифровым пространством. Современные языковые модели и агенты, способные выполнять сложные задачи, начинают переходить от простого анализа и генерации текстов к выполнению реальных действий в интернете и в приложениях. Однако при этом возникает фундаментальная проблема: основные цифровые интерфейсы, через которые традиционно осуществляется доступ к веб-сервисам и приложениям, изначально были созданы для человека, а не для машин. Это создает серьезные ограничения и порождает множество вызовов, с которыми вынуждены сталкиваться разработчики и исследователи в попытках подключить искусственный интеллект к сети в роли активного участника. Основной способ, которым сегодня многие ИИ-системы взаимодействуют с интернетом, - это использование браузеров в качестве посредника.

Такие "агенты-компьютерные пользователи" (Computer Use Agents, CUAs) просто повторяют действия человека - они "видят" страницу как изображение, "читают" её через распознавание визуальной информации, затем на основе анализа делают последовательность кликов мыши и наборов клавиш. Кажется логичным задействовать именно браузер: он универсален, охватывает огромный объем веб-ресурсов, и для доступа к ним не требуются дополнительные настройки или согласования с владельцами сайтов. Тем не менее, за этой кажущейся простотой скрываются серьезные архитектурные недостатки. Во-первых, такой подход чрезвычайно ресурсоемкий. Каждому агенту необходимо выделить виртуальную машину с полноценной операционной системой и браузером, что требует больших вычислительных мощностей и памяти.

Процесс также предполагает постоянную передачу и обработку больших изображений экрана. Крайне неэффективно тратить гигабайты визуальных данных, чтобы совершить действие, смысл которого можно записать в нескольких байтах, например, нажать кнопку "купить" или "добавить в корзину". При этом ИИ-модели обрабатывают на экране массу визуального шума: рекламные баннеры, меню, всплывающие окна, которые для человека являются лишь фоном, а для машины становятся серьезным источником помех. Этот подход похож на поиск книги по библиотеке, где сначала нужно визуально осмотреть каждую полку и потом вернуться повторить путь заново. Во-вторых, технология работы через браузер ограничивает скорость и надежность работы агентов.

 

Веб-интерфейсы создавались и оптимизировались под человеческую когнитивную модель, задачи эффективной загрузки и воспринимаемости пользователем. Они предусматривают анимации, задержки загрузки, многоэтапные процессы и защитные механизмы, призванные предотвратить автоматизацию или злоупотребления со стороны ботов. Даже идеальный ИИ не сможет выполнять действия быстрее, чем интерфейс позволяет - его возможности ограничены рамками человеческой скорости взаимодействия. В-третьих, безопасность и надежность становятся значительными вызовами. Современные браузеры являются сложными программными продуктами с многолетней историей и множеством уязвимостей.

 

При работе агента с браузером возникает риск экспозиции кода к вредоносному воздействию, а также невозможность полностью контролировать исходные действия агента, поскольку интерфейс построен на восприятии по изображению, а не на строгой логике. Кроме того, распространены системы капч, антивирусные и антибот-механизмы, препятствующие роботизации веб-серфинга. Это заставляет агентов "притворяться" человеком, создавая множество этических и технических сложностей. Попытки усовершенствовать данный подход посредством улучшения моделей, ускорения вычислений или помощи от интерфейса браузера - например, прямого взаимодействия с DOM - являются скорее временной компенсацией. DOM, хоть и представляет собой структуру веб-страницы, всё равно ориентирован на визуализацию для человека без учета семантического смысла, что делает взаимодействие с ним хрупким и нестабильным.

 

Малейшее обновление сайта может сломать алгоритм взаимодействия, приводя к дорогостоящей поддержке и необходимости постоянного администрирования. Глядя вперед, очевидно, что подход с агентов через браузер является архитектурным долгом. Он дает быстрый старт и широкий доступ, но при масштабировании сталкивается с высокой стоимостью, низкой эффективностью и недостаточной надежностью. Для большинства важных и часто повторяющихся задач в интернете кажется неизбежным переломить эту парадигму и перейти к разработке интерфейсов, оптимизированных именно для агентного взаимодействия. Такие агентно-ориентированные платформы позволят общаться с сервисами напрямую через четко определенные протоколы, APIs с семантически богатым описанием операций.

Это откроет дорогу к мгновенному и масштабируемому выполнению действий, с гораздо меньшими затратами ресурсов и повышенной надежностью безопасности. Хотя создание таких новых интерфейсов требует значительных вложений и совместных усилий разработчиков, платформ и регуляторов, выгоды в будущем будут неопровержимыми. Скорость выполнения заданий будет значительно выше, отказоустойчивость возрастет, а стоимость обслуживания - существенно снизится. Более того, это позволит обойти многие современные проблемы с безопасностью и этическими дилеммами, благодаря прозрачности и контролируемости инструментов. В то же время задачей сохранения совместимости с "длинным хвостом" интернета останется необходимость поддерживать браузерные агенты для взаимодействия с устаревшими системами, нишевыми сервисами и разовыми ресурсами.

Но экономическая сила и технологические преимущества новых интерфейсов заставят основные платформы и крупные игроки интернета неуклонно переводить свои сервисы в агентно-дружественный формат. Нельзя забывать, что будущее за автоматизацией и масштабируемым интеллектоцентричным взаимодействием с цифровой экосистемой. Выбирая путь наименьшего сопротивления сегодня, мы рискуем накопить огромные технические долги, которые придется расплачиваться в ближайшие годы. Переосмысление веб-интерфейсов и создание специализированных коммуникационных протоколов для искусственного интеллекта - вот направление, которое позволит развернуть новые горизонты и раскрыть весь потенциал агентов для улучшения нашей повседневной жизни и бизнеса. В конечном итоге, будущее действий ИИ в интернете заключается не в том, чтобы обучить машины "видеть" и "кликать", как человек, а в том, чтобы выстроить для них собственный язык взаимодействия - точный, быстрый и безопасный.

.

Автоматическая торговля на криптовалютных биржах

Далее
Touting better HIV treatment, Toronto service org closing after 42 years
Воскресенье, 04 Январь 2026 Закрытие AIDS Committee of Toronto после 42 лет работы: как медицинский прогресс меняет борьбу с ВИЧ в Канаде

Организация AIDS Committee of Toronto, одна из старейших в Канаде, закрывается после 42 лет работы, что связано с изменением потребностей в лечении ВИЧ благодаря медицинским достижениям и новым подходам к управлению заболеванием. .

Show HN: Platform for testing investment allocations using quant methods
Воскресенье, 04 Январь 2026 Инновационная платформа для тестирования инвестиционных портфелей с помощью количественных методов

Современные технологии открывают новые возможности для инвесторов в сфере управления активами. Платформа, предназначенная для тестирования инвестиционных портфелей с использованием количественных методов, предоставляет уникальные инструменты для оценки и оптимизации стратегий распределения капитала.

披薩外送外帶線上訂購 | 網路訂餐披薩享優惠 | Pizza Hut 必勝客
Воскресенье, 04 Январь 2026 Пицца на дом и с собой: почему заказывать онлайн в Pizza Hut - выгодно и удобно

Удобство заказа пиццы онлайн в сети Pizza Hut позволяет быстро и с выгодой получить любимое блюдо прямо к дверям или забрать самостоятельно. Узнайте, какие преимущества и специальные предложения доступны для заказчиков в Тайване.

台北披薩推薦!這6間讓你口水直流的PIZZA披薩店絕對不能錯過! - 小米蟲的米缸
Воскресенье, 04 Январь 2026 Лучшие пиццерии Тайбэя: 6 необычных мест с оригинальной пиццей, которую нельзя пропустить

Обзор самых интересных и необычных пиццерий Тайбэя с уникальными вкусами и концепциями, которые порадуют как поклонников классики, так и любителей креативной еды. Изучите самые популярные заведения с авторской пиццей и насладитесь новым гастрономическим опытом в столице Тайваня.

盤點雙北7家窯烤披薩!入選「亞太區50大」、橡皮艇披薩超熱門 | ETtoday旅遊雲 | ETtoday新聞雲
Воскресенье, 04 Январь 2026 Лучшие дровяные пиццерии Тайбэя и Новой Тайбэя: ТОП-7 избранных из Азии

Экскурсия по семи ведущим дровяным пиццериям регионов Тайбэй и Новая Тайбэй, которые вошли в список 50 лучших пицц Азии. Узнайте, почему эти заведения завоевали популярность и что делать, чтобы насладиться самой востребованной итальянской кухней с уникальной атмосферой.

台北人氣Pizza專賣店Top8!Gira Pizza、The Slice Shop社群爆紅 | Bella.tw儂儂
Воскресенье, 04 Январь 2026 Лучшие пиццерии Тайбэя: топ-8 самых популярных мест с настоящей итальянской пиццей

Обзор самых востребованных и любимых пиццерий Тайбэя, где можно попробовать аутентичную пиццу от профессионалов, включая известные места Gira Pizza и The Slice Shop. В статье рассказывается о разнообразии стилей, уникальных ингредиентах и атмосфере каждого заведения.

台北義式窯烤披薩|13間必吃冠軍餐廳名店都在這! - 妮喃小語
Воскресенье, 04 Январь 2026 Тайбэй и искусство итальянской пиццы: 13 лучших пиццерий с признанными чемпионами

Погрузитесь в разнообразие и аутентичность тайбэйских итальянских пиццерий, где классика неразрывно переплетается с инновациями. Узнайте о традициях неаполитанской пиццы и откройте для себя 13 исключительных заведений, завоевавших признание гурманов и профессионалов.