Implicit Kinodynamic Motion Retargeting for Human-to-humanoid Imitation Learning

2509.15443v1 cs.RO, cs.AI 2025-09-23
Авторы:

Xingyu Chen, Hanyu Wu, Sikai Wu, Mingliang Zhou, Diyun Xiang, Haodong Zhang

Резюме на русском

## Контекст Построение эффективных систем, позволяющих роботам воспроизводить руководство с помощью людей, является ключевым заданием в области робототехники. Одна из сложностей в этой области — научить роботу сохранять гармонию в ходе интеракции с человеком. Эффективность робота сильно зависит от того, насколько он точно может воспроизводить движения, приобретенные в процессе обучения. Одним из важных этапов в этом процессе является процесс **motion retargeting** — преобразование мотивации, выраженной человеком, в понятный для робота формат. На сегодняшний день, большинство методов motion retargeting опираются на работу с каждым кадром по отдельности. Это приводит к проблеме неэффективности при работе с большими наборами данных. Наша работа направлена на решение этой проблемы, предлагая новую модель Implicit Kinodynamic Motion Retargeting (IKMR), которая объединяет в себе две главные компоненты: **kinematics** и **dynamics**. ## Метод Методология IKMR основывается на двух основных компонентах: **масштабируемое представление темпоральных данных** в кинематике и **динамика робота** в динамике. - **Кинематика.** Мы предлагаем модель, которая тренируется на больших наборах данных с целью изучения множества возможных траекторий. Для этого мы используем двухэлементную сеть **encoder-decoder**, которая научилась предсказывать конечные траектории, учитывая темпоральную структуру данных. Это позволяет роботу оптимизировать пути движения, сохраняя их наиболее точно. - **Динамика.** Для того, чтобы полученные движения были физически возможными, мы интегрировали в модель **imitation learning**. Это позволяет нам учитывать внутреннюю динамику робота, а также гарантировать, что полученные траектории будут не только хорошо вписываться в пространство требований, но и будут выполняться на реальном роботе. ## Результаты Мы провести эксперименты на реальном роботе и в симуляционной среде с полноразмерным роботом. Наши результаты показали, что IKMR не только эффективнее существующих методов, но и позволяет достичь новых уровней точности воспроизведения движений. Мы провели анализ сравнения, показав, что наша модель дает более высокую точность воспроизведения, а также имеет более низкую стоимость ресурсов. Эти результаты доказывают, что наша модель может быть применена в реальных условиях, когда нужно воспроизводить жесты, приобретенные человеком, на роботе. ## Значимость Мы видим широкие возможности для применения нашей модели в различных областях, включая **роботизированное производство**, **роботы-компаньоны** и **прикладные технологии**. IKMR позволяет роботам более эффективно выполнять задачи, когда нужно сох

Abstract

Human-to-humanoid imitation learning aims to learn a humanoid whole-body controller from human motion. Motion retargeting is a crucial step in enabling robots to acquire reference trajectories when exploring locomotion skills. However, current methods focus on motion retargeting frame by frame, which lacks scalability. Could we directly convert large-scale human motion into robot-executable motion through a more efficient approach? To address this issue, we propose Implicit Kinodynamic Motion Retargeting (IKMR), a novel efficient and scalable retargeting framework that considers both kinematics and dynamics. In kinematics, IKMR pretrains motion topology feature representation and a dual encoder-decoder architecture to learn a motion domain mapping. In dynamics, IKMR integrates imitation learning with the motion retargeting network to refine motion into physically feasible trajectories. After fine-tuning using the tracking results, IKMR can achieve large-scale physically feasible motion retargeting in real time, and a whole-body controller could be directly trained and deployed for tracking its retargeted trajectories. We conduct our experiments both in the simulator and the real robot on a full-size humanoid robot. Extensive experiments and evaluation results verify the effectiveness of our proposed framework.

Ссылки и действия