MASH: Cooperative-Heterogeneous Multi-Agent Reinforcement Learning for Single Humanoid Robot Locomotion

2508.10423v1 cs.RO, cs.AI, cs.SY, eess.SY 2025-08-16
Авторы:

Qi Liu, Xiaopeng Zhang, Mingshan Tan, Shuaikang Ma, Jinliang Ding, Yanjie Li

Резюме на русском

#### Контекст Локомоция человеческого робота представляет одну из наиболее трудных и интересных областей исследований в области робототехники и искусственного интеллекта. Однако, существующие методы, основанные на сингл-агентных алгоритмах, часто не полностью раскрывают потенциал робота в условиях сложных локальных условий. Это приводит к узким и неэффективным решениям. Требуется новая парадигма, позволяющая улучшить локомоционные стратегии через более глубокое коллективное взаимодействие. Мотивация заключается в развитии многоагентных методов, которые могут более эффективно использовать характеристики робота в целом. #### Метод Метод MASH (Multi-Agent Reinforcement Learning for Single Humanoid Locomotion) основывается на кооперативно-гетерогенной многоагентной системе. Робот рассматривается как система, где каждая его нога и рука является отдельным агентом. Эти агенты взаимодействуют в рамках глобального системного критика, обучающегося с помощью многоагентного метода deep reinforcement learning (MARL). Отдельные агенты проводят формирование действий в своих пространствах, а критик обеспечивает коллективную оптимизацию. Данная архитектура позволяет увеличить степень взаимодействия между телом и его частями, что значительно улучшает локомоционные возможности. #### Результаты Работа проводилась на симуляционных моделях человеческих роботов, где были разработаны эксперименты для сравнения MASH с традиционными методами. Наблюдалось ускорение времени обучения и значительное улучшение глобальных локомоционных показателей, таких как стабильность и корректность движений. Данные результаты подтвердили, что MASH не только ускоряет обучение, но и повышает целостность локомоционной системы по сравнению с одноагентными системами. #### Значимость Полученные результаты открывают новые возможности применения многоагентных методов в решении задач локомоции для человеческих роботов. Этот подход может быть задействован в разработке более эффективных алгоритмов для роботов, которые оперируют в сложных трехмерных средах. Применение MASH может способствовать развитию робототехнических систем, увеличивая их скорость реакции и степень координации движений. #### Выводы MASH доказал свою эффективность в решении задач локомоции человеческого робота через кооперативно-гетерогенную многоагентную систему. Он ускоряет обучение и улучшает логичность движений по сравнению с традиционными методами. В будущем, этот подход может быть расширен для решения задач в других областях робототехники, где требуется мобильность и координация.

Abstract

This paper proposes a novel method to enhance locomotion for a single humanoid robot through cooperative-heterogeneous multi-agent deep reinforcement learning (MARL). While most existing methods typically employ single-agent reinforcement learning algorithms for a single humanoid robot or MARL algorithms for multi-robot system tasks, we propose a distinct paradigm: applying cooperative-heterogeneous MARL to optimize locomotion for a single humanoid robot. The proposed method, multi-agent reinforcement learning for single humanoid locomotion (MASH), treats each limb (legs and arms) as an independent agent that explores the robot's action space while sharing a global critic for cooperative learning. Experiments demonstrate that MASH accelerates training convergence and improves whole-body cooperation ability, outperforming conventional single-agent reinforcement learning methods. This work advances the integration of MARL into single-humanoid-robot control, offering new insights into efficient locomotion strategies.

Ссылки и действия