Как проектировать роботов с эластичными гибкими телами и управлять ими: Оптимизация мягких роботов для выполнения конкретных задач – огромная вычислительная проблема, но новая модель может помочь

Мягкие роботы имеют упругие, гибкие, эластичные тела, которые в любой момент могут двигаться бесконечным количеством направлений. С вычислительной точки зрения это представляет собой очень сложное «представление состояния», которое описывает, как движется каждая часть робота. Представления состояний для мягких роботов потенциально могут иметь миллионы измерений, что затрудняет расчет оптимального способа заставить робота выполнять сложные задачи.
На конференции по системам обработки нейронной информации в следующем месяце исследователи из Массачусетского технологического института представят модель, которая изучает компактное или «низкоразмерное», но подробное представление состояния, основанное, среди прочего, на физике, лежащей в основе робота и его среды.

Это помогает модели итеративно оптимизировать управление движением и параметры конструкции материала, соответствующие конкретным задачам.
«Мягкие роботы – это существа бесконечного измерения, которые в любой момент изгибаются миллиардом разных способов», – говорит первый автор Эндрю Спилберг, аспирант Лаборатории компьютерных наук и искусственного интеллекта (CSAIL). "Но, по правде говоря, мягкие предметы могут сгибаться естественным образом. Мы обнаружили, что естественные состояния мягких роботов могут быть очень компактно описаны в низкоразмерном описании.

Мы оптимизируем управление и дизайн мягких роботов, изучая хорошее описание вероятных состояний."
При моделировании модель позволяла программным роботам 2D и 3D выполнять задачи, такие как перемещение на определенные расстояния или достижение целевой точки, быстрее и точнее, чем современные современные методы. Далее исследователи планируют реализовать модель в реальных мягких роботах.

К работе со Спилбергом присоединились аспиранты CSAIL Аллан Чжао, Тао Ду и Юаньмин Ху; Даниэла Рус, директор CSAIL и профессор электротехники и информатики Эндрю и Эрна Витерби; и Войцех Матусик, доцент кафедры электротехники и информатики Массачусетского технологического института и руководитель группы Computational Fabrication Group.

«Постоянное обучение»
Мягкая робототехника – относительно новая область исследований, но она многообещающая для продвинутой робототехники.

Например, гибкие тела могут предложить более безопасное взаимодействие с людьми, лучшее манипулирование объектами и большую маневренность, среди других преимуществ.
Управление роботами в симуляциях полагается на «наблюдателя», программу, которая вычисляет переменные, которые видят, как мягкий робот движется, чтобы выполнить задачу. В предыдущей работе исследователи разложили мягкого робота на созданные вручную кластеры смоделированных частиц.

Частицы содержат важную информацию, которая помогает сузить возможные движения робота. Например, если робот пытается согнуться определенным образом, исполнительные механизмы могут сопротивляться этому движению настолько, что его можно игнорировать. Но для таких сложных роботов вручную выбрать, какие кластеры следует отслеживать во время моделирования, может быть непросто.

Основываясь на этой работе, исследователи разработали метод «оптимизации с непрерывным обучением», при котором все оптимизированные параметры изучаются в течение одного цикла обратной связи по множеству симуляций. И одновременно с оптимизацией обучения – или "в цикле" – метод также изучает представление состояния.

В модели используется метод, называемый методом материальных точек (MPM), который имитирует поведение частиц сплошных материалов, таких как пена и жидкости, окруженных фоновой сеткой. При этом он захватывает частицы робота и его наблюдаемую среду в пиксели или трехмерные пиксели, известные как воксели, без необходимости каких-либо дополнительных вычислений.

На этапе обучения эта необработанная информация сетки частиц подается в компонент машинного обучения, который учится вводить изображение, сжимать его до низкоразмерного представления и распаковывать представление обратно во входное изображение.

Если этот "автоэнкодер" сохраняет достаточно деталей при сжатии входного изображения, он может точно воссоздать входное изображение из сжатия.
В работе исследователей выученные сжатые представления автоэнкодера служат в качестве низкоразмерного представления состояния робота.

На этапе оптимизации это сжатое представление возвращается обратно в контроллер, который выводит расчетное срабатывание для того, как каждая частица робота должна двигаться на следующем шаге, смоделированном MPM.
Одновременно контроллер использует эту информацию для регулировки оптимальной жесткости каждой частицы для достижения желаемого движения. В будущем эта информация о материалах может быть полезна для 3D-печати мягких роботов, где каждое пятно частицы может быть напечатано с немного разной жесткостью. «Это позволяет создавать конструкции роботов, учитывающие движения роботов, которые будут иметь отношение к конкретным задачам», – говорит Спилберг. "Изучая эти параметры вместе, вы максимально синхронизируете все, чтобы упростить процесс проектирования."
Более быстрая оптимизация

Вся оптимизационная информация, в свою очередь, возвращается в начало цикла для обучения автоэнкодера. В ходе многих симуляций контроллер изучает оптимальное движение и конструкцию материалов, в то время как автоэнкодер изучает все более детальное представление состояния. «Ключ в том, что мы хотим, чтобы это низкоразмерное состояние было очень наглядным», – говорит Спилберг.
После того, как робот переходит в свое смоделированное конечное состояние в течение заданного периода времени – скажем, как можно ближе к целевому пункту назначения – он обновляет "функцию потерь"."Это важный компонент машинного обучения, который пытается свести к минимуму некоторые ошибки. В этом случае он минимизирует, скажем, расстояние, на котором робот остановился от цели.

Эта функция потерь возвращается к контроллеру, который использует сигнал ошибки для настройки всех оптимизированных параметров для наилучшего выполнения задачи.
Если бы исследователи попытались напрямую передать все необработанные частицы моделирования в контроллер без этапа сжатия, «время работы и оптимизации резко увеличилось бы», – говорит Спилберг.

Используя сжатое представление, исследователи смогли сократить время выполнения каждой итерации оптимизации с нескольких минут до примерно 10 секунд.
Исследователи подтвердили свою модель на симуляциях различных 2D и 3D двуногих и четвероногих роботов. Исследователи также обнаружили, что, хотя роботам, использующим традиционные методы, может потребоваться до 30 000 симуляций для оптимизации этих параметров, роботам, обученным на их модели, потребовалось всего около 400 симуляций.

Развертывание модели в реальных мягких роботах означает решение проблем с реальным шумом и неопределенностью, которые могут снизить эффективность и точность модели. Но в будущем исследователи надеются разработать полный конвейер, от моделирования до изготовления, для мягких роботов.
Видео: https: // www.YouTube.com / watch?v = cwxl3957Ysc