ИИ помог учёным создать робота-выживальщика

6 мин
ИИ помог учёным создать робота-выживальщика

Исследователи из Северо-Западного университета в Иллинойсе применили искусственный интеллект, чтобы создать высокоадаптивного робота. 

Обычно робототехнику создают с учётом конкретных условий окружающей среды, и она не обладает адаптивностью за этими пределами. Даже роботы, предназначенные для работы на открытом воздухе и обычно способные передвигаться по неровной местности, могут испытывать трудности, сталкиваясь с препятствиями, для преодоления которых они не были специально запрограммированы.

Исследователи из Северо-Западного университета изучают другой решение. Вместо того чтобы проектировать роботов для конкретных условий или пытаться предсказать каждый возможный сценарий, они экспериментируют с машинами, которые могут перестраиваться и адаптировать свои движения зависимо от ситуации. Результатом их работы стала «шагающая метамашина» — прочный модульный робот, который странно выглядит и движется, но способен функционировать, даже если его распилить пополам.

Робот состоит из нескольких модулей, похожих на детали конструктора Lego, которые могут собираться в разнообразные конфигурации. Каждый модуль представляет собой функционального робота, содержащего батарею, двигатель и компьютер. Конструкция относительно проста — центральный шар и две примыкающие к нему руки (или ноги), которые могут вращаться вокруг одной оси. Сам по себе компонент может независимо катиться, крутиться и прыгать. 

Каждый модульный блок состоит из двух звеньев и шарнирной сферы (A). Внутри сферы находится батарея (B), специальная печатная плата с встроенной электроникой обработки, датчиков и связи; (C), держатель печатной платы (D) и двигатель (E). Звенья могут свободно вращаться на 360° вокруг оси вращения, приводимой в движение двигателем. Используя эту единственную степень свободы, модуль может взлететь в воздух (F–I), повернуться на месте (J–M) и катиться вперед (N–P) по поверхности. Выученная стратегия поворота остаётся неизменной при переворачивании (L), сохраняя то же вращение по часовой стрелке (M). Выученная стратегия качения оказывает сопротивление при отталкивании назад (O), быстро тормозя и возобновляя движение вперёд (P). Один модуль может соединяться с другим в трёх ориентациях (повороты на 120°) в 18 точках соединения вдоль его шарнира и звеньев, что дает 435 различных вариантов двухмодульных тел (подмножество которых показано на рисунках Q–V). Док-станции крепятся с помощью гаек и болтов (W) и спроектированы таким образом, чтобы выдерживать высокие нагрузки во всех направлениях, что позволяет выполнять агрессивные динамические движения. Контроллер использует только внутренние (проприоцептивные и вестибулярные) датчики; данные захвата движений контроллеру не предоставлялись.
Каждый модульный блок состоит из двух звеньев и шарнирной сферы (A). Внутри сферы находится батарея (B), специальная печатная плата с встроенной электроникой обработки, датчиков и связи; (C), держатель печатной платы (D) и двигатель (E). Звенья могут свободно вращаться на 360° вокруг оси вращения, приводимой в движение двигателем. Используя эту единственную степень свободы, модуль может взлететь в воздух (F–I), повернуться на месте (J–M) и катиться вперед (N–P) по поверхности. Выученная стратегия поворота остаётся неизменной при переворачивании (L), сохраняя то же вращение по часовой стрелке (M). Выученная стратегия качения оказывает сопротивление при отталкивании назад (O), быстро тормозя и возобновляя движение вперёд (P). Один модуль может соединяться с другим в трёх ориентациях (повороты на 120°) в 18 точках соединения вдоль его шарнира и звеньев, что дает 435 различных вариантов двухмодульных тел (подмножество которых показано на рисунках Q–V). Док-станции крепятся с помощью гаек и болтов (W) и спроектированы таким образом, чтобы выдерживать высокие нагрузки во всех направлениях, что позволяет выполнять агрессивные динамические движения. Контроллер использует только внутренние (проприоцептивные и вестибулярные) датчики; информация захвата движений контроллеру не предоставлялись.

В собранном виде конструкция выглядит интереснее. Обмениваясь данными через внутренние компьютеры, она может прыгать, ползать, катиться, волнообразно двигаться и выполнять много других движений, которые довольно хаотичны, но одновременно весьма эффективны. 

По сути, робот выполняет свою задачу — любым способом добраться из точки А в точку Б. Модульная конструкция выступает источником его «неуязвимости». Если какой-либо компонент отсоединится от сборки или получит повреждение, остальная часть машины найдёт способ продолжить движение, выполняя свою основную задачу.

Пятимодульная конструкция (A) была обучена совершать прыжки и повороты по требованию, вращая тело в воздухе на 66° по часовой стрелке вокруг поперечной плоскости (B–F). Конструкция также была обучена поддерживать вертикальную позу и походку, самостоятельно выравниваясь в перевёрнутом положении (G–L). При переворачивании вверх ногами (с помощью деревянной доски; красная точка на H) конструкция быстро изгибается и скручивает тело, чтобы восстановить вертикальную позу и походку (L). Все конструкции, созданные в рамках результатов данной работы, оказались способными к обучению этим акробатическим действиям.
Пятимодульная конструкция (A) была обучена совершать прыжки и повороты по требованию, вращая тело в воздухе на 66° по часовой стрелке вокруг поперечной плоскости (B–F). Конструкция также была обучена поддерживать вертикальную позу и походку, самостоятельно выравниваясь в перевёрнутом положении (G–L). При переворачивании вверх ногами (с помощью деревянной доски; красная точка на H) конструкция быстро изгибается и скручивает тело, чтобы восстановить вертикальную позу и походку (L). Все конструкции, созданные в рамках результатов данной работы, оказались способными к обучению этим акробатическим действиям.

Вместо того чтобы проектировать робота напрямую, команда предоставила ИИ набор строительных блоков, модулей и простую цель: найти наиболее эффективный метод передвижения техники. Затем ИИ запустил процедура рассуждений, имитирующий естественную эволюцию.

Для генерации последовательностей сенсомоторных обучающих данных для различных ампутаций моделируемого четвероногого робота (A–F) использовались экспертные стратегии. В дополнение к исходному контроллеру локомоции, который был принят за эксперта для неповреждённого робота (A и F), были предварительно обучены три дополнительные экспертные стратегии, соответствующие потере одной (B и D), двух (C) или четырёх конечностей (E) соответственно. Генеративная модель успешного поведения была получена путём авторегрессивного прогнозирования сенсомоторных взаимосвязей экспертов во времени (G), подобно тому, как языковая модель изучает правила грамматики из текста. Имея недавнюю историю сенсорных наблюдений, обученная модель предсказывает оптимальное двигательное действие. Это понимание правил успешного поведения было использовано в качестве стратегии, не зависящей от ампутации, которая позволяет физическому роботу (H) сохранять функциональность после радикальных изменений в его строении тела (I–K). Политика, не зависящая от ампутации (L–O), и исходная экспертная политика робота (P-S) были протестированы на трёх ранее не встречавшихся сценариях повреждений (I–K), а также на многих других в симуляции. У неповреждённого робота чистое перемещение, генерируемое политикой, не зависящей от ампутации (красная полоса на H), статистически не отличалось от исходной политики (синяя полоса на H и серые полосы на I–K). При удалении одной задней конечности в случайной точке разреза (I), удалении обеих задних конечностей (J) и сохранении всех модулей, кроме одного (K), политика, не зависящая от ампутации, неизменно генерировала большее движение вперёд, чем исходная.
Для генерации последовательностей сенсомоторных обучающих данных для различных ампутаций моделируемого четвероногого робота (A–F) использовались экспертные стратегии. В дополнение к исходному контроллеру локомоции, который был принят за эксперта для неповреждённого робота (A и F), были предварительно обучены три дополнительные экспертные стратегии, соответствующие потере одной (B и D), двух (C) или четырёх конечностей (E) соответственно. Генеративная схема успешного поведения была получена путём авторегрессивного прогнозирования сенсомоторных взаимосвязей экспертов во времени (G), подобно тому, как языковая модель изучает правила грамматики из текста. Имея недавнюю историю сенсорных наблюдений, обученная схема предсказывает оптимальное двигательное действие. Это понимание правил успешного поведения было использовано в качестве стратегии, не зависящей от ампутации, которая даёт возможность физическому роботу (H) сохранять функциональность после радикальных изменений в его строении тела (I–K). Политика, не зависящая от ампутации (L–O), и исходная экспертная политика робота (P-S) были протестированы на трёх ранее не встречавшихся сценариях повреждений (I–K), а также на многих других в симуляции. У неповреждённого робота чистое перемещение, генерируемое политикой, не зависящей от ампутации (красная полоса на H), статистически не отличалось от исходной политики (синяя полоса на H и серые полосы на I–K). При удалении одной задней конечности в случайной точке разреза (I), удалении обеих задних конечностей (J) и сохранении всех модулей, кроме одного (K), политика, не зависящая от ампутации, неизменно генерировала большее движение вперёд, чем исходная.

«Эволюция может выявлять новые конструкции, отличающиеся от того, что люди могли себе представить раньше, или даже превосходящие эти догадки. Поэтому мы действительно хотели изучить, как и почему это работает. Лучший способ, или, по чрезвычайной мере, самый увлекательный, — это заставить эволюционировать структуры в реалистичных условиях», — объясняет Сэм Кригман, руководитель исследования и эксперт по биороботике. 

В компьютерной симуляции ИИ сгенерировал тысячи возможных конфигураций роботов. Каждая конструкция была протестирована в бесчисленных экстремальных виртуальных средах. Наиболее успешные конструкции, те, которые двигались дальше или лучше справлялись с препятствиями, были сохранены, а более слабые отброшены.

Из поколения в поколение конструкции эволюционировали, пока ИИ не создал высокоэффективные конфигурации. Затем разработчики физически собрали их.

В ходе испытаний на открытом воздухе получившийся робот эффективно передвигался по различным пересечённым поверхностям, в том числе траву, гравий и грязь. 

«Эти роботы могут выжить, если их разрубить пополам или разрезать на множество частей. При разделении каждый модуль внутри метамашины может стать отдельным агентом», — сообщает Кригман. 

Исследователи также утверждают, что это начальный эволюционировавший робот, который вышел за пределы симуляции и попал в реальный мир. 

Пока техника находится на самых ранних стадиях развития. Например, у машины нет внешних датчиков, она не может видеть препятствия или составлять карту окружающей среды. Робот может определять свою собственную ориентацию (перевёрнут ли он или застрял) и положение модулей. С другой стороны, он медленный, неуклюжий и не обладает сенсорными возможностями, необходимыми для решения реальных задач.

Даже сами исследователи признают, что робот пока не особенно полезен. Одна из целей проекта — изменить представление инженеров о роботах. Благодаря эволюционной робототехнике, основанной на искусственном интеллекте, исследователи решили фундаментальную задачу любого эволюционирующего вида: выживания.

Между тем в MIT представили Wave-Former — систему, которая позволяет роботу восстанавливать 3D-форму предметов, скрытых за картоном, гипсокартоном, деревом или тканью. Для этого используются миллиметровые радиоволны (те же, что в Wi-Fi) и специально обученная генеративная модель.

А исследователи из Университета штата Оклахома пытаются решить проблему ошибок в работе робототехники, обучая машины реагировать на человеческие инстинкты в режиме реального времени. Команда разрабатывает нейроадаптивную систему управления, которая позволяет роботам улавливать сигналы из человеческого мозга и мгновенно корректировать свои действия. Итак, если оператор-человек чувствует, что что-то идёт не так, робот должен отреагировать до того, как ошибка возникнет в реальном мире.

Читают сейчас

Разработчик Amazon выявил регрессию в тестовом ядре Linux 7.0, в два раза снижающую эффективность PostgreSQL

11 минут назад

Разработчик Amazon выявил регрессию в тестовом ядре Linux 7.0, в два раза снижающую эффективность PostgreSQL

Разработчик из Amazon Сальваторе Дипьетро обнаружил регрессию при тестировании СУБД PostgreSQL и компонентов готовившегося к релизу ядра Linux 7.0. Выпуск новой версии ядра Linux, которая будет исполь

Экипаж лунной миссии «Артемида» II на космическом корабле «Орион» преодолел больше половины пути до Луны

1 час назад

Экипаж лунной миссии «Артемида» II на космическом корабле «Орион» преодолел больше половины пути до Луны

В НАСА сообщили, что экипаж лунной миссии «Артемида» II на космическом корабле «Орион» преодолел больше половины пути до Луны. В настоящий момент корабль находится приблизительно в 141 тыс. км от Луны

Представлен публике дистрибутив Netrunner 26 на Debian 13 «Trixie» и Linux 6.16

1 час назад

Представлен публике дистрибутив Netrunner 26 на Debian 13 «Trixie» и Linux 6.16

В начале апреля 2026 года разработчик проекта Nitrux Ури Эррера объявил о выпуске и общедоступности сборки Netrunner 26 (кодовое название Twilight), спустя более года после выхода Netrunner 25. Инициа

Версия библиотеки meshoptimizer 1.1

2 часа назад

Версия библиотеки meshoptimizer 1.1

2 апреля 2026 года разработчик Arseny Kapoulkine (zeux) представил обновление открытой библиотеки meshoptimizer 1.1. Исходный исходник проекта написан на C++ и JavaScript и опубликован на GitHub под л

Claude Code нашел 23-летний дефект в Linux

8 часов назад

Claude Code нашел 23-летний дефект в Linux

Николас Карлини, исследователь из Anthropic, рассказал на конференции [un]prompted 2026, что с помощью Claude Code обнаружил несколько удаленно эксплуатируемых уязвимостей в ядре Linux. Одна из них —