16 апреля 2026, 11:47

Робособаку Boston Dynamics научили считывать показания приборов и обнаруживать утечки

3 мин

Организация Boston Dynamics интегрировала Google DeepMind в своего робота-собаку Spot, обеспечив ему более автономное мышление для проведения промышленных инспекций, таких как обнаружение утечек и считывание показаний приборов. Spot также теперь может распознавать, когда необходимо задействовать другие инструменты искусственного интеллекта.

Робот Spot теперь оснащён моделью Gemini Robotics-ER 1.6 от Google DeepMind — высокоуровневой моделью воплощённого мышления, которая обеспечивает интеллектуальные возможности для решения сложных задач.

За счёт ИИ робособака способна автономно искать опасный мусор или разливы, считывать показания сложных приборов и смотровых стекол, а также применять такие инструменты, как модели «зрение-язык-действие», когда ей нужна помощь в понимании происходящего в окружающей среде.

Вместо написания формальной программной логики исследователи взаимодействовали с Gemini Robotics, используя разговорный язык. Используя SDK Spot, они разработали слой, который упростил взаимодействие между Gemini Robotics и программным интерфейсом (программный интерфейс) Spot. api обычно предоставляет разработчикам доступ к возможностям робота для создания пользовательских приложений или моделей поведения. Например, исследователи из Meta* использовали Spot для тестирования того, как платформа искусственного интеллекта может находить и извлекать объекты, которые она никогда раньше не видела.

Для начала требовалось объяснить Gemini Robotics, что ему нужно создавать. При написании базовых инструкций исследователи столкнулись с определёнными трудностями. Простые указания, такие как «положите объект» или «сделайте снимок», были недостаточно подробными для воспроизведения ожидаемого поведения. Пришлось добавлять контекст в описания по мере доработки каждого инструмента.

Вот пример инструкции:

This command will cause the robot to take a picture with the specified camera. There is some nuance to choosing the correct camera. Once arriving at a location using GoTo, you should always start by taking a picture with the gripper camera, because it’s the most informative. If the robot has arrived at location and is already holding an object, you can do one of two things:
Immediately call PutDown
Search the area with either of the front cameras. The front cameras are low to the ground, so if you’re trying to put things on an elevated surface, they won’t give you useful information.

Отмечается, что во многих отношениях Gemini Robotics работает идентично оператору, вручную управляющему Spot с помощью планшетного контроллера.

Когда Gemini Robotics задействует тот или иной средство, инструмент отвечает результатами и контекстом, например: «Я поднял объект» или «Я не могу поднять что-то, пока у меня занята рука». Затем Gemini Robotics вносит корректировки на лету на основе обратной связи от Spot. В частности, чтобы поднять обувь, Gemini Robotics запрашивает изображение, идентифицирует обувь на этом изображении и вызывает команду «поднять». Создавая базовые инструменты, которые семантически взаимодействуют, Gemini Robotics может управлять последовательностью задач, необходимых для уборки комнаты. Существующий программный стек Spot управляет перемещением, навигацией и манипуляциями самого робота.

Важно отметить, что Gemini Robotics имеет строгие ограничения в этом сценарии. Компания не может изобретать новые возможности или управлять Spot за пределами того, что доступно через api. Это делает поведение Spot предсказуемым, позволяя Gemini Robotics адаптироваться к различным ситуациям.

Пока сотрудничество с Google Deepmind находится на ранней стадии, тем не менее в Boston Dynamics уже внедрили фактические улучшения для Spot и Orbit с помощью AIVI-Learning на базе Google Gemini Robotics ER 1.6. Улучшения моделей происходят автоматически в фоновом режиме.

Ранее Boston Dynamics официально представила коммерческую версию робота Atlas для реальной работы на заводах и складах. Одновременно компания объявила о стратегическом партнерстве с Google, в контексте которого гуманоидный робот получит интеграцию с моделями Gemini Robotics. Это позволит перевести Atlas из категории высокоточного механического исполнителя в класс интеллектуальных агентов, способных понимать окружение и адаптироваться к новым задачам.

_{Meta Platforms*, а равным образом принадлежащие ей социальные сети Facebook** и Instagram**:}
_{* — признана экстремистской организацией, её деятельность в России запрещена}
_{** — запрещены в России}

boston dynamics spot google deepmind gemini robotics роботы робособака искусственный интеллект промышленность промышленная автоматизация

Читают сейчас

34 минуты назад

Отчет KPMG про агентный ИИ создал текст ИИ. Он похвалил сам себя и наврал почти во всех ссылках

Аудиторская организация KPMG, одна из "крупный четверки", отозвала свой отчет о пользе агентного ИИ — после того как стало известно, что сам документ оказался наглядной демонстрацией главной проблемы

1 час назад

Google отключил оператор inurl

Ранее Google ограничил количество результатов поиска по оператору site, а теперь полностью отключил и inurl — поисковый оператор, который позволял находить документы содержащие нужную последовательнос

2 часа назад

Вышло апдейт мультиплатформенного проекта RevPDF 4.5 — альтернатива Adobe Acrobat

13 июня 2026 года состоялся версия мультиплатформенного проекта RevPDF 4.5. Это маленький, бесплатный, работающий в автономном режиме редактор PDF-файлов с возможностью редактирования текста, скрытия

4 часа назад

Microsoft выпустила версию PowerToys 0.100.0

Организация Microsoft выпустила PowerToys версии 0.100.0. Выпуск содержит исправления и улучшения для нескольких модулей, а наиболее важные изменения касаются повышения производительности, уменьшения

5 часов назад

Апдейт Telegram: форматирование ботов и Markdown-файлы

Telegram опубликовал крупное обновление с десятками новых функций, в том числе с поддержкой мессенджера на смарт-часах, в том числе с Wear OS, а также опциями для ботов, групп и встроенного браузера.