TrajBooster: Boosting Humanoid Whole-Body Manipulation via Trajectory-Centric Learning

2509.11839v1 cs.RO, cs.CV 2025-09-17
Авторы:

Jiacheng Liu, Pengxiang Ding, Qihang Zhou, Yuxuan Wu, Da Huang, Zimian Peng, Wei Xiao, Weinan Zhang, Lixin Yang, Cewu Lu, Donglin Wang

Резюме на русском

## Контекст В последние годы повышается интерес к развитию методов, позволяющих роботам вести себя в сложных средах, особенно в задачах целостной манипуляции. Одной из основных проблем в этой области является нехватка методов, которые могут эффективно обрабатывать целостные задачи, в том числе те, которые требуют высокой точности в условиях динамических изменений. Эта сложность порождается накоплением ошибок при использовании имитационных методов обучения. Эти методы, хотя и эффективны в маломасштабных задачах, часто сталкиваются с трудностями в достижении высокой точности при работе с задачами, требующими длительного просмотра и точной координации. Мы предлагаем TrajBooster, алгоритм, который использует глобальную модель динамики для более точной рефинирования траекторий движений, улучшая результаты в сложных сценариях. ## Метод TrajBooster основывается на идее резидентного управления, которая добавляет дополнительные коррекции к основной политике. Но в отличии от предыдущих подходов, TrajBooster использует теорию Коопмана для моделирования глобальных динамических свойств в задачах целостной манипуляции. Это позволяет ему учитывать глобальные изменения состояния в процессе работы, что обеспечивает более стабильное и точное движение робота. Мы используем нейронные сети для моделирования этих глобальных свойств, что делает TrajBooster гибким и эффективным для различных задач. ## Результаты Мы проводили эксперименты на сложных задачах, включающих целостную манипуляцию, таких как сборка мебели, с использованием различных моделей роботов. Результаты показали, что TrajBooster показывает значительное улучшение в сравнении с другими методами, особенно в случаях, когда требуется высокая точность и устойчивость. Мы также провели эксперименты в условиях внешних помех, и TrajBooster показал высокую резистентность и гибкость в решении этих проблем. ## Значимость TrajBooster может быть применен в различных областях, где требуется точность и устойчивость движения роботов, например, в производстве, а также в сфере робототехники домашних услуг. Опытные исследования показали, что TrajBooster не только улучшает качество исполнения задач, но и сокращает время обучения, что делает его привлекательным для реального применения. Этот подход может стать ключевым элементом в развитии будущих роботизированных систем. ## Выводы Мы представили TrajBooster, новый подход к улучшению траекторий движения роботов в задачах целостной манипуляции. Наши результаты показали, что этот подход эффективен в различных условиях и может решать проблемы с целостной манипуляцией, требующими высокой точност

Abstract

Imitation learning (IL) enables efficient skill acquisition from demonstrations but often struggles with long-horizon tasks and high-precision control due to compounding errors. Residual policy learning offers a promising, model-agnostic solution by refining a base policy through closed-loop corrections. However, existing approaches primarily focus on local corrections to the base policy, lacking a global understanding of state evolution, which limits robustness and generalization to unseen scenarios. To address this, we propose incorporating global dynamics modeling to guide residual policy updates. Specifically, we leverage Koopman operator theory to impose linear time-invariant structure in a learned latent space, enabling reliable state transitions and improved extrapolation for long-horizon prediction and unseen environments. We introduce KORR (Koopman-guided Online Residual Refinement), a simple yet effective framework that conditions residual corrections on Koopman-predicted latent states, enabling globally informed and stable action refinement. We evaluate KORR on long-horizon, fine-grained robotic furniture assembly tasks under various perturbations. Results demonstrate consistent gains in performance, robustness, and generalization over strong baselines. Our findings further highlight the potential of Koopman-based modeling to bridge modern learning methods with classical control theory. For more details, please refer to https://jiachengliu3.github.io/TrajBooster.

Ссылки и действия