Google DeepMind продолжает ускоренными темпами развивать технологии искусственного интеллекта и робототехники. В июне 2025 года компания анонсировала выпуск новой модели Gemini Robotics On-Device, способной работать напрямую на самом роботе, без необходимости подключения к облачным сервисам и интернету. Это значимый шаг, который обещает изменить подход к использованию роботов в промышленности, бытовой сфере и других важных областях жизни. Главное преимущество новой модели Gemini заключается в ее автономности. Ранее для выполнения сложных задач роботы чаще всего требовали подключения к мощным облачным серверам, что ограничивало их мобильность и зависимость от стабильного интернет-соединения.
Gemini Robotics On-Device меняет правила игры, позволяя роботам выполнять сложные операции локально, что существенно расширяет возможности для их применения в ситуациях, где доступ к облаку невозможен или нежелателен. Технология базируется на достижениях предыдущей версии Gemini Robotics, представленной в марте 2025 года. Новая модель способна не только управлять движениями робота, но и распознавать и адаптироваться к неожиданным условиям и новым объектам, с которыми робот ранее не сталкивался. Это стало возможным благодаря улучшенному алгоритму обработки естественного языка и возможности тонкой настройки модели разработчиками через понятные инструкции и команды. Одним из показательных примеров работы Gemini Robotics On-Device стал демонстрационный ролик, в котором роботы выполняют бытовые задачи.
Они умело расстегивают молнии на сумках, аккуратно складывают одежду и справляются с другими деликатными действиями. Такой уровень точности и адаптивности свидетельствует о высоком качестве обучения модели и ее способности к гибкому взаимодействию с окружающим миром. Google также сообщила, что несмотря на изначальную ориентацию модели на роботов ALOHA, разработчики смогли адаптировать Gemini Robotics On-Device для работы с другими современными платформами, включая биармовый робот Franka FR3 и гуманоидный робот Apollo компании Apptronik. Особенно впечатляющим оказался робот Franka FR3, который с помощью новой модели смог успешно выполнять задачи, требующие сборки на промышленной конвейерной линии, даже при работе с новыми для него объектами и сценариями. Для разработчиков Google подготовила специальный SDK – программный набор для работы с Gemini Robotics.
С помощью этого инструментария можно обучать роботов новыми задачами всего на основе 50-100 демонстраций, используя симулятор физики MuJoCo. Это существенно облегчает интеграцию модели в различные роботы и ускоряет процесс обучения, что делает технологию более доступной для широкого круга специалистов и компаний. В то время как Google является одним из лидеров отрасли, в сфере робототехники и создания AI-моделей для роботов работают и другие значимые игроки. Nvidia развивает платформу, ориентированную на создание базовых моделей для гуманоидов, поддерживая создание универсальных решений. Компания Hugging Face выступает в роли платформы с открытыми моделями и наборами данных, активно сотрудничая с разработчиками роботов и открывая возможности для сообщества.
Южнокорейский стартап RLWRLD, поддерживаемый инвестициями Mirae Asset, нацелен на создание основополагающих моделей для роботов, что свидетельствует о глобальном интересе к развитию этой технологии. Внедрение локального управления роботами на базе модели Gemini открывает перспективы не только в промышленной сфере, но и в бытовой жизни, медицине, логистике и образовании. Роботы с повышенной автономностью смогут работать в удаленных и труднодоступных местах, где интернет-соединение нестабильно или отсутствует вовсе. Это критически важно для нефтегазовой отрасли, сельского хозяйства и спасательных операций в чрезвычайных ситуациях. Кроме того, локальное выполнение задач существенно снижает риски, связанные с безопасностью данных и конфиденциальностью.
Так как информация обрабатывается непосредственно на устройстве, уменьшается вероятность утечки данных и возможных кибератак, что делает решения на базе Gemini Robotics On-Device более надежными и привлекательными для корпоративных клиентов. В долгосрочной перспективе развитие таких моделей как Gemini Robotics On-Device будет способствовать ускоренной автоматизации задач различного уровня сложности. Роботы смогут работать не только в виде сложных производственных машин, но и в роли надежных ассистентов в повседневной жизни, эффективно взаимодействуя с людьми и адаптируясь к окружающей среде. Google с ее моделью Gemini вновь демонстрирует готовность задавать тренды в области искусственного интеллекта и робототехники, подтверждая статус лидера отрасли. Технология, которая ранее казалась отдаленным будущим, становится доступной уже сегодня, открывая перед человечеством новые горизонты возможностей.
Таким образом, новая модель Gemini Robotics On-Device является важным достижением в области локального управления роботами, сочетая передовые алгоритмы искусственного интеллекта с удобством и автономностью. Ее внедрение способно изменить подход к применению роботов, увеличивая их эффективность, безопасность и универсальность. Впереди нас ожидает эпоха, когда роботы с локальными AI-моделями будут повсеместно интегрированы в промышленность, сервисные сферы и бытовую жизнь, преобразуя представления о взаимодействии человека и машины и выводя технологии на следующий уровень развития.