Self-Guided Action Diffusion

2508.12189v1 cs.RO, cs.AI 2025-08-19

Авторы:

Rhea Malhotra, Yuejiang Liu, Chelsea Finn

Резюме на русском

## Контекст Большинство современных роботизированных систем используют генерируемые политики для того, чтобы удовлетворять потребностям в быстром и точным решении проблем. Одной из ключевых задач в этой области является повышение эффективности и реактивности диффузионных политик, которые используются для управления роботами в ситуациях, требующих оперативной реакции на изменения вокруг них. Дело в том, что разнообразие действий, которые могут быть приняты в определенной ситуации, может быть очень велико, что приводит к увеличению сложности обучения и применения политик. Наша мотивация заключается в разработке более эффективного метода для повышения консистентности и реактивности диффузионных политик, не увеличивая тем самым затраты на вычисления. ## Метод Мы предлагаем **Self-Guided Action Diffusion**, новый подход к диффузионным политикам, который использует информацию о предыдущих решениях для улучшения выбора действий на каждом шаге диффузии. Наш метод основывается на принципе **self-guided proposal distribution**, что позволяет уменьшить количество вычислений, необходимых для достижения оптимального решения. Мы используем **bidirectional decoding** для повышения консистентности, но в отличие от существующих подходов, мы руководствуем самим процессом распространения действий, чтобы уменьшить издержки на вычисления и увеличить реактивность. ## Результаты Мы провели эксперименты в симуляционных задачах, где протестировали нашу модель на различных типах динамических задач. Мы сравнивали нашу реализацию с существующими методами, используя одинаковые условия и размеры выборки. Результаты показали, что **Self-Guided Action Diffusion** достигает **до 70% более высоких успешных результатов** в случаях, когда доступно ограниченное количество выборок. Это демонстрирует высокую эффективность нашего подхода в условиях, где производительность и реактивность крайне важны. ## Значимость Наш метод может быть применен в различных сферах, где требуется высокая реактивность и точность управления. Например, в современных роботизированных системах, в работе с автономными транспортными средствами, в робототехнике, а также в медицинском робототехническом оборудовании. Одним из основных преимуществ нашего подхода является **низкая вычислительная сложность**, что делает его привлекательным для применения в реальном времени. Мы считаем, что наш метод может существенно повлиять на развитие робототехнических систем, улучшая их эффективность и надежность. ## Выводы Мы представили **Self-Guided Action Diffusion**, новый эффективный подход к диффузионным политикам, который позволяет достигать высоких успешных результатов с мини

Abstract

Recent works have shown the promise of inference-time search over action samples for improving generative robot policies. In particular, optimizing cross-chunk coherence via bidirectional decoding has proven effective in boosting the consistency and reactivity of diffusion policies. However, this approach remains computationally expensive as the diversity of sampled actions grows. In this paper, we introduce self-guided action diffusion, a more efficient variant of bidirectional decoding tailored for diffusion-based policies. At the core of our method is to guide the proposal distribution at each diffusion step based on the prior decision. Experiments in simulation tasks show that the proposed self-guidance enables near-optimal performance at negligible inference cost. Notably, under a tight sampling budget, our method achieves up to 70% higher success rates than existing counterparts on challenging dynamic tasks. See project website at https://rhea-mal.github.io/selfgad.github.io.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Self-Guided Action Diffusion

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Open-Ended Goal Inference through Actions and Language for Human-Robot Collabora...

Using Machine Learning to Take Stay-or-Go Decisions in Data-driven Drone Mission...

CRAFT-E: A Neuro-Symbolic Framework for Embodied Affordance Grounding

World Models for Autonomous Navigation of Terrestrial Robots from LIDAR Observat...

A Learning-based Control Methodology for Transitioning VTOL UAVs

Навигация