Diffusion-Based Impedance Learning for Contact-Rich Manipulation Tasks
2509.19696v1
cs.RO, cs.AI, cs.LG
2025-09-26
Авторы:
Noah Geiger, Tamim Asfour, Neville Hogan, Johannes Lachner
Резюме на русском
#### Контекст
Modern методы машинного обучения достигли значительных успехов в генерации моторных действий в информационной сфере. Однако взаимодействие с физическим окружением в энергетической сфере, особенно в случае контактно-богатых задач, остается сложной проблемой. Это обусловлено тем, что традиционные подходы не ориентированы на учет физических принципов взаимодействия, а именно на них закладывается основа Impedance Control. Он требует точной настройки задачно-связанных параметров импеданса, что затрудняет применение в ситуациях, требующих высокой адаптивности. Наше исследование фокусируется на создании структуры, которая объединяет моделирование в физической сфере и методы машинного обучения для генерации точных и адаптивных импедансных контроллеров.
#### Метод
Мы предлагаем Diffusion-Based Impedance Learning — универсальную архитектуру, которая включает в себя следующие компоненты. Первый этап — использование Transformer-based Diffusion Model, который обучается по данным симуляционных нулевых силовых траекторий (sZFT) с применением cross-attention к внешним векторам сил. Это позволяет модели генерировать в точности движение в трансляционном и вращательном пространствах. Для решения проблемы геометрической консистентности во вращательном пространстве мы вводим SLERP-based quaternion noise scheduler. Второй этап — обновление параметров импеданса (стиффнесс и демпфинг) с помощью energy-based estimator. Этот этап включает в себя дирекционный подход: контроллер уменьшает импеданс вдоль незадачных осей, оставляя высокую резистивность вдоль задачных направлений. Мы собирали данные в сценарии паркура и робототехнической терапии с помощью Apple Vision Pro.
#### Результаты
Проведенные эксперименты показали высокую эффективность метода. На данных, собранных в сценарии паркура, модель достигла суб-миллиметровой точности позиции и суб-динамической точности подвижных роботов. Модель показала успех в решении задачи подгонки в контактных контактовых задачах, в том числе поворотов и вставки эллиптических и цилиндрических точек, без предварительных демонстраций в обучающих данных. Это достигнуто благодаря возможности автоматической адаптации импеданса во время выполнения задачи. Уменьшенный размер модели позволил применять этот подход в реальном времени, в том числе с автоматическим корректированием динамики на KUKA LBR iiwa.
#### Значимость
Предложенный подход может быть применен в различных контактно-богатых задачах, в том числе в робототехнических терапиях, производственных процессах и распределенных системах с удаленным управлением. Он обеспечивает высокую точность и реактивность, объединяя моде
Abstract
Learning methods excel at motion generation in the information domain but are
not primarily designed for physical interaction in the energy domain. Impedance
Control shapes physical interaction but requires task-aware tuning by selecting
feasible impedance parameters. We present Diffusion-Based Impedance Learning, a
framework that combines both domains. A Transformer-based Diffusion Model with
cross-attention to external wrenches reconstructs a simulated Zero-Force
Trajectory (sZFT). This captures both translational and rotational task-space
behavior. For rotations, we introduce a novel SLERP-based quaternion noise
scheduler that ensures geometric consistency. The reconstructed sZFT is then
passed to an energy-based estimator that updates stiffness and damping
parameters. A directional rule is applied that reduces impedance along non task
axes while preserving rigidity along task directions. Training data were
collected for a parkour scenario and robotic-assisted therapy tasks using
teleoperation with Apple Vision Pro. With only tens of thousands of samples,
the model achieved sub-millimeter positional accuracy and sub-degree rotational
accuracy. Its compact model size enabled real-time torque control and
autonomous stiffness adaptation on a KUKA LBR iiwa robot. The controller
achieved smooth parkour traversal within force and velocity limits and 30/30
success rates for cylindrical, square, and star peg insertions without any
peg-specific demonstrations in the training data set. All code for the
Transformer-based Diffusion Model, the robot controller, and the Apple Vision
Pro telemanipulation framework is publicly available. These results mark an
important step towards Physical AI, fusing model-based control for physical
interaction with learning-based methods for trajectory generation.
Ссылки и действия
Дополнительные ресурсы: