16 апреля 2026, 11:47
Робособаку Boston Dynamics научили считывать показания приборов и обнаруживать утечки
Организация Boston Dynamics интегрировала Google DeepMind в своего робота-собаку Spot, обеспечив ему более автономное мышление для проведения промышленных инспекций, таких как обнаружение утечек и считывание показаний приборов. Spot также теперь может распознавать, когда необходимо задействовать другие инструменты искусственного интеллекта.
Робот Spot теперь оснащён моделью Gemini Robotics-ER 1.6 от Google DeepMind — высокоуровневой моделью воплощённого мышления, которая обеспечивает интеллектуальные возможности для решения сложных задач.
За счёт ИИ робособака способна автономно искать опасный мусор или разливы, считывать показания сложных приборов и смотровых стекол, а также применять такие инструменты, как модели «зрение-язык-действие», когда ей нужна помощь в понимании происходящего в окружающей среде.
Вместо написания формальной программной логики исследователи взаимодействовали с Gemini Robotics, используя разговорный язык. Используя SDK Spot, они разработали слой, который упростил взаимодействие между Gemini Robotics и программным интерфейсом (программный интерфейс) Spot. api обычно предоставляет разработчикам доступ к возможностям робота для создания пользовательских приложений или моделей поведения. Например, исследователи из Meta* использовали Spot для тестирования того, как платформа искусственного интеллекта может находить и извлекать объекты, которые она никогда раньше не видела.
Для начала требовалось объяснить Gemini Robotics, что ему нужно создавать. При написании базовых инструкций исследователи столкнулись с определёнными трудностями. Простые указания, такие как «положите объект» или «сделайте снимок», были недостаточно подробными для воспроизведения ожидаемого поведения. Пришлось добавлять контекст в описания по мере доработки каждого инструмента.
Вот пример инструкции:
This command will cause the robot to take a picture with the specified camera. There is some nuance to choosing the correct camera. Once arriving at a location using GoTo, you should always start by taking a picture with the gripper camera, because it’s the most informative. If the robot has arrived at location and is already holding an object, you can do one of two things:
Immediately call PutDown
Search the area with either of the front cameras. The front cameras are low to the ground, so if you’re trying to put things on an elevated surface, they won’t give you useful information.
Отмечается, что во многих отношениях Gemini Robotics работает идентично оператору, вручную управляющему Spot с помощью планшетного контроллера.
Когда Gemini Robotics задействует тот или иной средство, инструмент отвечает результатами и контекстом, например: «Я поднял объект» или «Я не могу поднять что-то, пока у меня занята рука». Затем Gemini Robotics вносит корректировки на лету на основе обратной связи от Spot. В частности, чтобы поднять обувь, Gemini Robotics запрашивает изображение, идентифицирует обувь на этом изображении и вызывает команду «поднять». Создавая базовые инструменты, которые семантически взаимодействуют, Gemini Robotics может управлять последовательностью задач, необходимых для уборки комнаты. Существующий программный стек Spot управляет перемещением, навигацией и манипуляциями самого робота.
Важно отметить, что Gemini Robotics имеет строгие ограничения в этом сценарии. Компания не может изобретать новые возможности или управлять Spot за пределами того, что доступно через api. Это делает поведение Spot предсказуемым, позволяя Gemini Robotics адаптироваться к различным ситуациям.
Пока сотрудничество с Google Deepmind находится на ранней стадии, тем не менее в Boston Dynamics уже внедрили фактические улучшения для Spot и Orbit с помощью AIVI-Learning на базе Google Gemini Robotics ER 1.6. Улучшения моделей происходят автоматически в фоновом режиме.
Ранее Boston Dynamics официально представила коммерческую версию робота Atlas для реальной работы на заводах и складах. Одновременно компания объявила о стратегическом партнерстве с Google, в контексте которого гуманоидный робот получит интеграцию с моделями Gemini Robotics. Это позволит перевести Atlas из категории высокоточного механического исполнителя в класс интеллектуальных агентов, способных понимать окружение и адаптироваться к новым задачам.
Meta Platforms*, а равным образом принадлежащие ей социальные сети Facebook** и Instagram**:
* — признана экстремистской организацией, её деятельность в России запрещена
** — запрещены в России
Читают сейчас

44 минуты назад
Авторы Telega: заказчик Telega не превращает iPhone в «кирпич» после обновления до iOS 26.4.1
Разработчики Telega заявили, что их альтернативный клиент Telegram не превращает iPhone в «кирпич» после обновления до iOS 26.4.1. В команде проекта пояснили. что проблемы в связи с обновления не связ
51 минуту назад
Инициатива World Альтмана интегрирует технологию верификации в приложения для знакомств
Инициатива Сэма Альтмана по верификации пользователей World заключает партнёрство с Tinder, чтобы интегрировать свою технологию верификации в программа для знакомств. Аналогичные технологии планируетс

55 минут назад
Альтман покинет OpenAI перед IPO? Его сделки слишком часто обогащают не OpenAI, а его самого
The Wall Street Journal опубликовала расследование о личных инвестициях CEO OpenAI Сэма Альтмана. Часть акционеров компании стартовали приватно обсуждать, стоит ли именно ему вести OpenAI на IPO с цел
1 час назад
В Duolingo прекратили отслеживать использование сотрудниками ИИ при оценке эффективности
В апреле 2025 года генеральный директор Duolingo Луис фон Ан объявил, что система будет отслеживать использование ИИ сотрудниками в процессе оценки их работы. Теперь топ-менеджер заявил, что этот пока

2 часа назад
Исследование: для разблокировки по лицу на Android-смартфонах можно применять фото
Тесты в лабораториях Which выявили, что функцию блокировки по лицу во многих современных смартфонах можно обойти, используя лишь фотографию владельца. Читать далее