17 : 52 : 53
23 марта 2025 г.

Роботы на ножках успешно катаются на скейтборде с помощью системы обучения с подкреплением

Роботы на ногах, которые часто вдохновляются образами животных и насекомых, могут помочь людям выполнять различные задачи в реальном мире, например, доставлять посылки или следить за определёнными условиями. В последние годы учёные-компьютерщики создали алгоритмы, которые позволяют этим роботам ходить с разной скоростью, прыгать, имитировать некоторые движения животных и передвигаться с большой ловкостью.

Исследователи из Лаборатории вычислительной автономности и робототехники Мичиганского университета (CURLY Lab) и Южного университета науки и технологий разработали систему на основе обучения с подкреплением, которая позволяет роботам с ногами успешно использовать скейтборд. Эта система, описанная в статье на сервере препринтов arXiv, также может быть использована для имитации других сложных движений в реальном мире, которые предполагают физический контакт с окружающими предметами.

Существующие подходы к передвижению на четырёх конечностях не учитывают взаимодействие с объектами, например, при катании на скейтборде. Наша работа была направлена на создание конвейера для таких задач, ориентированных на взаимодействие с объектами, которые стоит изучить, в том числе катание на скейтборде. Мичиганский университет имеет долгую историю разработки гибридных динамических систем, что вдохновило нас на выявление таких гибридных эффектов с помощью подходов на основе данных в ИИ.

для Tech Xplore Сангли Тенг, автор статьи

Основная цель недавней работы Тенга и его коллег состояла в том, чтобы позволить шагающим роботам выполнять движения, управляемые контактом, в том числе кататься на скейтборде. Для этого они разработали новую систему под названием "обучение гибридных автоматов в дискретном времени" (DHAL). "Гибридная динамика" означает, что система может выполнять как непрерывные, так и дискретные переходы между состояниями. По сути, это означает, что она может плавно и резко менять своё состояние с течением времени.

Например, когда подпрыгивающий мяч взаимодействует с землёй, мяч имеет непрерывную динамику в воздухе и дискретные переходы между состояниями при столкновении с землёй.

Сангли Тенг, автор статьи для для Tech Xplore

Эксперт указал, что для систем с несколькими непрерывными динамическими процессами и функциями перехода крайне сложно одновременно определить дискретный режим и непрерывную динамику. Это связано с тем, что количество возможных дискретных переходов растёт экспоненциально по отношению к числу возможных непрерывных переходов".

Резкие переходы, описанные Тенгом, затрудняют использование традиционных вычислительных методов на основе регрессии для изучения динамики системы. DHAL, платформа, разработанная исследователями, может выявлять эти резкие переходы и впоследствии изучать каждый непрерывный сегмент динамики системы с помощью методов на основе регрессии, уменьшая эффект прерывания, который, как было обнаружено, снижает производительность роботов при выполнении таких задач, как катание на скейтборде.

По сравнению с существующими методами DHAL не требует ручной идентификации дискретного перехода или предварительного знания количества переходных состояни. Всё в DHAL является эвристическим, и мы показали, что наш метод может самостоятельно определять переход между режимами динамики.

Сангли Тенг, автор статьи для для Tech Xplore

Ещё одним преимуществом платформы DHAL является то, что она очень интуитивно понятна, а значит, переходы между режимами, которые она определяет, соответствуют тем, которые обычно ассоциируются со скейтбордингом. В ходе первых испытаний исследователи обнаружили, что платформа позволяет четвероногим (то есть четвероруким) роботам плавно вставать на скейтборд и использовать его для быстрого движения вперёд, а также тянуть за собой небольшую тележку.

На этапах толчка, скольжения и подъёма DHAL автоматически выводит различные метки. Наш метод можно применить для оценки состояния гибридных динамических систем, чтобы выяснить, происходит ли такой переход. Благодаря этой информации о переходе система может лучше оценивать состояния, чтобы помочь в принятии решений.

Сангли Тенг, автор статьи для для Tech Xplore

Эффективность идентификации режима. В реальных условиях мы подсвечиваем разные цвета RGB-световых полос в зависимости от режима, чтобы показать переключение между режимами. На следующем рисунке показано изменение положения суставов относительно времени в ходе теста, а цвет фона соответствует цвету соответствующего режима. [H, T, C] обозначают тазобедренный, бедренный и голеностопный суставы соответственно. Новая система обучения с подкреплением, разработанная Тенгом и его коллегами, вскоре может открыть новые возможности для использования шагающих роботов в реальном мире. Например, она может позволить им быстрее передвигаться на скейтборде, доставляя посылки по городу, в офисах или на производственных предприятиях.

Теперь мы планируем применить эту систему в других сценариях, таких как ловкие манипуляции (т. е. манипуляции с объектами с помощью нескольких пальцев или рук). Ожидается, что DHAL будет более точно прогнозировать контакт, что позволит алгоритмам планирования и управления принимать более взвешенные решения.

Сангли Тенг, автор статьи для для Tech Xplore

Смертоносные бактерии научились вырабатывать противомикробные вещества.

Фото и видео:  Liu et al; arXiv (2025)

Данные о правообладателе фото и видеоматериалов взяты с сайта «Piter.tv», подробнее в Правилах сервиса