В последние годы робототехника активно развивается, интегрируясь с возможностями больших языковых моделей и современных методов искусственного интеллекта. Одним из наиболее интересных проектов этого направления стал Shoggoth Mini — мягкий робот с щупальцами, сочетающий сложное механическое устройство с интеллектуальными алгоритмами управления на базе GPT-4o и обучения с подкреплением. Его создатель, Matthieu Le Cauchois, исследует не только функциональность будущих роботов, но и то, насколько они способны быть выразительными, живыми и естественно взаимодействовать с людьми. В основе Shoggoth Mini лежит идея, что роботы будущего должны не просто выполнять задачи, но и обладать внятной внутренней выразительностью. Как показала работа Apple над исследованием ELEGNT, простые жесты и движения, подобные знаменитому мультипликационному персонажу Pixar — лампе Luxo, способны транслировать намерения, внимание и эмоции.
Другой источник вдохновения — проект SpiRobs, мягкий робот с щупальцами, движения которого кажутся живыми даже при минимальном контроле. Shoggoth Mini объединяет эти идеи, стремясь вывести экспрессию робота на новый уровень. Физическая конструкция Shoggoth Mini состоит из трех основных моторов, которые управляют натяжением кабелей, работающих как сухожилия щупальца. Поначалу автор использовал простую 3D-печатную платформу с куполом из пластика, который случайно приобрел вид лица с помощью нарисованных глаз. Это неожиданный случай стал отправной точкой для фирменного дизайна, который выглядит одновременно мило и слегка пугающе — создавая необычную атмосферу, присущую инопланетному животному.
Одной из ключевых проблем при разработке было сохранение натяжения кабелей и предотвращение их запутывания. Для этого были добавлены защитные кожухи и дополнительные механизмы калибровки натяжения. Эти простые инженерные решения существенно повысили надежность и скорость модификаций. Также пришлось утолщить основу щупальца, чтобы избежать провисания из-за собственной массы, сохраняя при этом достаточную гибкость для выражения разнообразных движений. Для контроля робота была выбрана двухмерная проекция управления.
Три кабеля имеют направления, составляющие треугольник в плоскости, и движения управляются путем манипуляций курсором на трекпаде. Эта интуитивная схема позволяет легко менять длину каждого из кабелей, сокращая или удлиняя их, чтобы направлять движение щупальца. Эта 2D-модель стала основой как для ручного управления, так и для программных политик, включая автоматические сценарии и обучение с подкреплением. Программы управления разделены на два слоя. Низкоуровневый сконструирован из жестко заданных движений и политик с обратной связью, основанных на визуальном отслеживании.
Для последнего используются стереокамеры, фиксирующие положение кончика щупальца и руки пользователя. Первоначальная идея добавить датчики внутри самого щупальца оказалась слишком сложной технически, поэтому была выбрана наружная оптика. Это решение наложило ограничения на зону видимости, которые были компенсированы реализованным естественным поведением автоматической центровки, когда щупальце возвращается в поле зрения при выходе за его пределы. Высокоуровневое управление реализует GPT-4o, который анализирует аудиопоток и получает текстовые подсказки с событиями, распознаваемыми зрительной системой, такими как жесты пользователя. GPT-4o, используя современные методы генерации кода, принимает решения о том, какие базовые команды следует послать роботу.
Концепция вдохновлена исследованиями DeepMind, где подобные модели без специализированного обучения могут управлять роботами с разнообразными формами тела. В Shoggoth Mini GPT-4o функционирует в реальном времени, реагируя на команды и синхронизируя движения щупальца с действиями человека. В отличие от моделей, строго обученных на демонстрациях, где требуется жесткое соответствие движений и положения, мягкий робот требует более гибкого подхода, так как многие конфигурации кабелей дают один и тот же итоговый результат движения. Для решения этой проблемы автор предпочел каскадный подход с разделением восприятия и низкоуровневого управления, что облегчило воплощение системы в жизнь и дало простор для развития интеллектуальных политик. Шоггот Мини особенно привлекает внимание благодаря выраженному поведению, которое создается не только через активные движения, но и через фоновые, кажущиеся случайными колебания, имитирующие дыхание.
Это позволяет роботу казаться живым даже во время простой паузы, создавая владелецу впечатление взаимодействия с независимым существом. Разработка системы восприятия включала в себя обучение моделей компьютерного зрения для отслеживания руки пользователя и кончика щупальца. Используя современные инструменты, такие как MediaPipe и YOLO, а также дополнительный искусственный интеллект для аннотации изображений, была создана точная система, обеспечивающая трехмерную локализацию объектов с помощью калибровки камер. Методы обучения с подкреплением позволили создать умные политики, способные следить за рукой пользователя и плавно повторять движения. В симуляции была применена рандомизация физических параметров, чтобы повысить устойчивость к реальным условиям и уменьшить расхождение между виртуальным и физическим миром.
Для стабилизации поведения были введены технические решения, сглаживающие резкие изменения команд и предотвращающие «дребезг» в движениях. В результате получился робот, который не только способен выполнять разнообразные задачи, но и выражать внутреннее состояние через движения, порождая ощущение живого существа. Создатель проекта задается вопросом, насколько нам необходимы роботы-субъекты с высокой степенью непредсказуемости, ведь слишком агентное поведение может вызвать у человека дискомфорт. Тем не менее, баланс между выразительностью и предсказуемостью является важной задачей будущих исследований. В планах автора расширение функционала Shoggoth Mini, включая добавление нового звукового сопровождения, увеличение числа щупалец, освоение ползания и использование более точных двигателей для снижения шума.
Также рассматривается переход от ограниченного двумерного управления к более свободным пространственным стратегиям, что позволит роботу становиться еще более живым и разнообразным в своих движениях. Shoggoth Mini — пример уникального симбиоза механики, программирования и искусственного интеллекта. Он помогает понять, что роботы будущего не должны быть лишь утилитарными инструментами, а способны становиться выразительными, интерактивными существами, с которыми человек может выстраивать более естественный и эмоциональный контакт. Этот проект служит вдохновением для исследователей и разработчиков в области мягкой робототехники и ИИ, демонстрируя, как творческий подход и передовые технологии способны изменить наше представление о роботах.