LocoFormer: Generalist Locomotion via Long-context Adaptation

2509.23745v1 cs.RO, cs.AI 2025-10-01
Авторы:

Min Liu, Deepak Pathak, Ananye Agarwal

Резюме на русском

## Контекст Современные контроллеры движения легкого робота обычно требуют ручного адаптирования к конкретной морфологии и динамике робота. Это связано с тем, что традиционные подходы не способны адаптироваться к вариациям морфологии и динамики робота в процессе эксплуатации. Такая ситуация приводит к неэффективности, увеличению времени настройки и повышению вероятности ошибок во время работы. Это является ключевой проблемой в развитии универсальных систем контроля движения, которые могут быть эффективно применены к разным роботам без необходимости переучивать или ручной адаптации. LocoFormer — это попытка развития универсального обобщенного робототехнического моделирования движения, который может быть применен к различным типам роботов без предварительной настройки. Он призван решить проблему неуниверсальности существующих контроллеров, обеспечивая гибкость, настройку и отсутствие требования к знанию морфологии и динамики робота при начале работы. ## Метод LocoFormer основывается на использовании глубокого обучения с подкреплением (Reinforcement Learning, RL), с масштабированным процессом тренировки на массовом количестве произвольно генерируемых физически моделируемых роботов. Для обеспечения универсальности используется агрессивная доменная рандомизация, которая симулирует различные виды роботов с разными характеристиками кинематики и динамики. В отличие от многих предыдущих подходов, LocoFormer использует продленную контекстную информацию, простирающуюся за пределы отдельного эпизода и включающую в себя данные из прошлых эпизодов. Это позволяет модели учитывать сложные зависимости в поведении робота, что является ключевым для адаптации к новым условиям. Данная модель укрепляет свою модель динамики, используя процедурные генераторы для тренировки на широком спектре возможных сценариев. ## Результаты LocoFormer был протестирован на широком спектре роботов с различными морфологиями и динамиками, включая роботов с ногами и колесами, с различными состояниями дисбаланса. На экспериментах показано, что модель демонстрирует устойчивый контроль даже при высоких значительных корректирующих воздействиях, таких как изменение массы, несоответствие модели кинематики и даже полное отключение моторов. В чрезвычайных ситуациях, таких как опускания, LocoFormer продемонстрировала способность осваивать новые стратегии движения на основе ошибок в первых этапах, что указывает на ее устойчивость и возможность улучшения в процессе работы. Такая способность вывода позволяет модели не только генерировать стабильное движение, но и адаптироваться к непредвиден

Abstract

Modern locomotion controllers are manually tuned for specific embodiments. We present LocoFormer, a generalist omni-bodied locomotion model that can control previously unseen legged and wheeled robots, even without precise knowledge of their kinematics. LocoFormer is able to adapt to changes in morphology and dynamics at test time. We find that two key choices enable adaptation. First, we train massive scale RL on procedurally generated robots with aggressive domain randomization. Second, in contrast to previous policies that are myopic with short context lengths, we extend context by orders of magnitude to span episode boundaries. We deploy the same LocoFormer to varied robots and show robust control even with large disturbances such as weight change and motor failures. In extreme scenarios, we see emergent adaptation across episodes, LocoFormer learns from falls in early episodes to improve control strategies in later ones. We believe that this simple, yet general recipe can be used to train foundation models for other robotic skills in the future. Videos at generalist-locomotion.github.io.

Ссылки и действия