Efficient Learning-Based Control of a Legged Robot in Lunar Gravity

2509.10128v1 cs.RO, cs.AI 2025-09-16
Авторы:

Philip Arm, Oliver Fischer, Joseph Church, Adrian Fuhrer, Hendrik Kolvenbach, Marco Hutter

Резюме на русском

## Контекст Легкие роботы с ногами (legged robots) представляют собой перспективные средства для исследования земель низко-гравитационных объектов, таких как Луна, Марс и астероиды. Их мобильность на неорганизованных территориях делает их привлекательными для этих задач. Однако планетарные роботы имеют ограниченные ресурсы на время работы и тепловыделение, что требует энергоэффективных алгоритмов управления, которые могут быть легко адаптированы к различным условиям гравитации. Наша цель — разработать метод совершенствования управления роботом, оптимизированный под экономию энергии и распространяющийся на различные условия гравитации. ## Метод Мы предлагаем метод оптимизации управления легким роботом на основе расширенного подхода обучения с подкреплением (reinforcement learning). Наша методика включает в себя создание модели поведения робота, которая учитывает параметры гравитации и требуемые энергопотери. Мы разработали систему с высокой гибкостью, которая может адаптироваться в разных условиях гравитации, используя специальные наградные функции, которые масштабируются в зависимости от уровня гравитации. Наша методика также включает в себя процесс визуализации и оценки результатов, чтобы проверить эффективность наших контроллеров. ## Результаты Мы провели эксперименты в трех различных условиях гравитации: лунной (1.62 м/с²), земной (9.81 м/с²) и гипотетической сверх-земной (19.62 м/с²). Наша система показала способность масштабирования в этих средах, используя новую наградную систему, которая учитывает эффективность использования энергии. Мы протестировали два типа контроллеров: для позиционирования основы робота (base pose controller) и для движения (locomotion controller). Показатели эффективности энергии для робота в лунной гравитации (23.4 Вт при 0.4 м/с) и земной гравитации (23% экономии энергии по сравнению с базовым алгоритмом) подтвердили успешность нашего подхода. Мы также использовали специальный спринг-оффлоад-систему, позволяющую проводить реальные эксперименты в условиях лунной гравитации. ## Значимость Наш подход имеет широкое применение в исследованиях в недвижимости роботов на Луне, Марсе и других земель низко-гравитационных объектов. Он предоставляет энергоэффективные алгоритмы управления, которые могут быть легко адаптированы к различным условиям гравитации. Благодаря гибкости и эффективности, наш метод может существенно повысить эффективность исследований на планетах с низкой гравитацией и снизить требования к ре

Abstract

Legged robots are promising candidates for exploring challenging areas on low-gravity bodies such as the Moon, Mars, or asteroids, thanks to their advanced mobility on unstructured terrain. However, as planetary robots' power and thermal budgets are highly restricted, these robots need energy-efficient control approaches that easily transfer to multiple gravity environments. In this work, we introduce a reinforcement learning-based control approach for legged robots with gravity-scaled power-optimized reward functions. We use our approach to develop and validate a locomotion controller and a base pose controller in gravity environments from lunar gravity (1.62 m/s2) to a hypothetical super-Earth (19.62 m/s2). Our approach successfully scales across these gravity levels for locomotion and base pose control with the gravity-scaled reward functions. The power-optimized locomotion controller reached a power consumption for locomotion of 23.4 W in Earth gravity on a 15.65 kg robot at 0.4 m/s, a 23 % improvement over the baseline policy. Additionally, we designed a constant-force spring offload system that allowed us to conduct real-world experiments on legged locomotion in lunar gravity. In lunar gravity, the power-optimized control policy reached 12.2 W, 36 % less than a baseline controller which is not optimized for power efficiency. Our method provides a scalable approach to developing power-efficient locomotion controllers for legged robots across multiple gravity levels.

Ссылки и действия