Query-Centric Diffusion Policy for Generalizable Robotic Assembly

2509.18686v1 cs.RO, cs.LG 2025-09-25

Авторы:

Ziyi Xu, Haohong Lin, Shiqi Liu, Ding Zhao

Резюме на русском

## Контекст Роботическая сборка является ключевым заданием в поиске общих решений для роботов, особенно в контактно-богатых ситуациях. Это задача требует точного взаимодействия между составляющими, а также высокой точности управления. Наиболее распространенный подход предполагает два уровня: высокоуровневый планирований и низкоуровневый контроль. Однако на практике реализация такого подхода становится сложной из-за несоответствия между высокоуровневым управлением и точным выполнением. Это приводит к проблемам в сбалансированном управлении, в том числе в работе с неопределенностями данных в реальном времени. Мы предлагаем Query-Centric Diffusion Policy (QDP), современный подход к решению этой проблемы, который объединяет высокоуровневое планирование с низкоуровневым управлением. ## Метод QDP — это достижение в области робототехники, которое работает на основе диффузионной модели. Оно включает в себя несколько этапов: 1. **Запрос-центричная структура**: QDP определяет требуемые действия, опираясь на запросы, в которых включены объекты, точки контакта и типы действий. 2. **Диффузионная модель**: Эта модель обнаруживает затрудненные области в задаче и учитывает их при выполнении. 3. **Обработка точечных облаков**: QDP использует точечные облака для улучшения точности и устойчивости. Эта методология позволяет оптимизировать способность робота к точному выполнению задач, даже в условиях нестандартных условий. ## Результаты Наши эксперименты проводились на двух уровнях: в симуляционной среде и на реальном роботе. Мы использовали данные из FurnitureBench, чтобы оценить качество управления в сложных задачах, таких как вставка и затяжка винтов. Результаты показывают, что QDP превышает базовые модели на 50% в сборе точных действий и увеличивает успешность в долгосрочных задачах. Особенно выдающимися результатами она демонстрируется в сложных задачах, где требуется точность в управлении. ## Значимость Мы видим приложение QDP в области промышленного робототехнического управления, где необходима высокая точность и устойчивость. Метод может применяться в многообразных сферах, включая роботическую сборку и управление сложными системами. QDP демонстрирует повышение эффективности и надежности, что может привести к значительным преимуществам в промышленных приложениях. ## Выводы Результаты QDP отличаются повышенной точностью и устойчивостью в сборочных задачах. Мы планируем продолжить исследования в области улучшения точности и быстродействия, а также расширить применение QDP в реальных роботических системах.

Abstract

The robotic assembly task poses a key challenge in building generalist robots due to the intrinsic complexity of part interactions and the sensitivity to noise perturbations in contact-rich settings. The assembly agent is typically designed in a hierarchical manner: high-level multi-part reasoning and low-level precise control. However, implementing such a hierarchical policy is challenging in practice due to the mismatch between high-level skill queries and low-level execution. To address this, we propose the Query-centric Diffusion Policy (QDP), a hierarchical framework that bridges high-level planning and low-level control by utilizing queries comprising objects, contact points, and skill information. QDP introduces a query-centric mechanism that identifies task-relevant components and uses them to guide low-level policies, leveraging point cloud observations to improve the policy's robustness. We conduct comprehensive experiments on the FurnitureBench in both simulation and real-world settings, demonstrating improved performance in skill precision and long-horizon success rate. In the challenging insertion and screwing tasks, QDP improves the skill-wise success rate by over 50% compared to baselines without structured queries.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Query-Centric Diffusion Policy for Generalizable Robotic Assembly

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Cross-embodied Co-design for Dexterous Hands

OmniDexVLG: Learning Dexterous Grasp Generation from Vision Language Model-Guide...

Digital Twin-based Control Co-Design of Full Vehicle Active Suspensions via Deep...

Modality-Augmented Fine-Tuning of Foundation Robot Policies for Cross-Embodiment...

GR-RL: Going Dexterous and Precise for Long-Horizon Robotic Manipulation

Навигация