Keypoint-based Diffusion for Robotic Motion Planning on the NICOL Robot

2509.04076v1 cs.RO, cs.AI 2025-09-06

Авторы:

Lennart Clasmeier, Jan-Gerrit Habekost, Connor Gäde, Philipp Allgeuer, Stefan Wermter

Резюме на русском

## Контекст Роботическое движение — это важная задача в робототехнике, которая требует высокой точности и эффективности. На данный момент, для решения проблемы планирования движения используются технологии типа RRT (Rapidly-exploring Random Tree) или A*, но они требуют существенного времени для расчетов, особенно при работе с большими данными. Эта проблема становится критичной для реального времени в ситуациях, где робот должен быстро реагировать на изменяющуюся среду. Наша модель Keypoint-based Diffusion предлагает решение этой проблемы, используя методы глубокого обучения для создания более быстрого и точного алгоритма планирования движения. ## Метод Мы предлагаем Keypoint-based Diffusion, модель, основанную на распространении, для планирования движения робота. Модель использует точечные облака, полученные от 3D-сенсора, чтобы выдавать последовательности кейпоинтов для управления роботом. Мы обучаем модель с помощью данных, сгенерированных традиционными планировщиками, но наше абляционное исследование показало, что сеть сложно подстраивается под искажения в точечных облаках. Чтобы улучшить модель, мы удалили эти искажения из данных, что привело к существенному повышению точности и стабильности. Несмотря на то, что использование точечных облаков в качестве входных данных дало дополнительные преимущества, модель вполне способна работать без них, уменьшая задержку в реальном времени. ## Результаты Мы провели эксперименты с нашим алгоритмом на реальном роботе NICOL, который используется для обучения роботов. Мы сравнили нашу модель с традиционными планировщиками, такими как RRT. Наши результаты показали, что Keypoint-based Diffusion работает на порядок быстрее, выполняя планирование за несколько секунд вместо нескольких минут. Мы достигли успешного планирования движения на 90% из тестовых случаев, даже при сложных условиях. Этот результат показывает, что наш алгоритм гораздо эффективнее традиционных методов, особенно в реальном времени. ## Значимость Модель Keypoint-based Diffusion имеет широкие применения в робототехнике. Она может быть использована для планирования движения в сложных интерьерах, а также для применения в автоматизированных системах. Одним из основных преимуществ является уменьшение времени реакции, что важно для реального времени. Этот подход также может быть применен для разработки более эффективных алгоритмов в других областях, таких как системы визуального обозрения и системы самоуправляемых машин. ## Выводы Мы успешно разработали модель Keypoint-based Diffusion для планирования движения роботов, которая оказалась эффективнее существующих методов. Наш алгоритм показал себя как быстрый и точный в реальном времени. Мы планируем

Abstract

We propose a novel diffusion-based action model for robotic motion planning. Commonly, established numerical planning approaches are used to solve general motion planning problems, but have significant runtime requirements. By leveraging the power of deep learning, we are able to achieve good results in a much smaller runtime by learning from a dataset generated by these planners. While our initial model uses point cloud embeddings in the input to predict keypoint-based joint sequences in its output, we observed in our ablation study that it remained challenging to condition the network on the point cloud embeddings. We identified some biases in our dataset and refined it, which improved the model's performance. Our model, even without the use of the point cloud encodings, outperforms numerical models by an order of magnitude regarding the runtime, while reaching a success rate of up to 90% of collision free solutions on the test set.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Keypoint-based Diffusion for Robotic Motion Planning on the NICOL Robot

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Open-Ended Goal Inference through Actions and Language for Human-Robot Collabora...

Using Machine Learning to Take Stay-or-Go Decisions in Data-driven Drone Mission...

CRAFT-E: A Neuro-Symbolic Framework for Embodied Affordance Grounding

World Models for Autonomous Navigation of Terrestrial Robots from LIDAR Observat...

A Learning-based Control Methodology for Transitioning VTOL UAVs

Навигация