Self-Guided Action Diffusion
2508.12189v1
cs.RO, cs.AI
2025-08-19
Авторы:
Rhea Malhotra, Yuejiang Liu, Chelsea Finn
Резюме на русском
## Контекст
Большинство современных роботизированных систем используют генерируемые политики для того, чтобы удовлетворять потребностям в быстром и точным решении проблем. Одной из ключевых задач в этой области является повышение эффективности и реактивности диффузионных политик, которые используются для управления роботами в ситуациях, требующих оперативной реакции на изменения вокруг них. Дело в том, что разнообразие действий, которые могут быть приняты в определенной ситуации, может быть очень велико, что приводит к увеличению сложности обучения и применения политик. Наша мотивация заключается в разработке более эффективного метода для повышения консистентности и реактивности диффузионных политик, не увеличивая тем самым затраты на вычисления.
## Метод
Мы предлагаем **Self-Guided Action Diffusion**, новый подход к диффузионным политикам, который использует информацию о предыдущих решениях для улучшения выбора действий на каждом шаге диффузии. Наш метод основывается на принципе **self-guided proposal distribution**, что позволяет уменьшить количество вычислений, необходимых для достижения оптимального решения. Мы используем **bidirectional decoding** для повышения консистентности, но в отличие от существующих подходов, мы руководствуем самим процессом распространения действий, чтобы уменьшить издержки на вычисления и увеличить реактивность.
## Результаты
Мы провели эксперименты в симуляционных задачах, где протестировали нашу модель на различных типах динамических задач. Мы сравнивали нашу реализацию с существующими методами, используя одинаковые условия и размеры выборки. Результаты показали, что **Self-Guided Action Diffusion** достигает **до 70% более высоких успешных результатов** в случаях, когда доступно ограниченное количество выборок. Это демонстрирует высокую эффективность нашего подхода в условиях, где производительность и реактивность крайне важны.
## Значимость
Наш метод может быть применен в различных сферах, где требуется высокая реактивность и точность управления. Например, в современных роботизированных системах, в работе с автономными транспортными средствами, в робототехнике, а также в медицинском робототехническом оборудовании. Одним из основных преимуществ нашего подхода является **низкая вычислительная сложность**, что делает его привлекательным для применения в реальном времени. Мы считаем, что наш метод может существенно повлиять на развитие робототехнических систем, улучшая их эффективность и надежность.
## Выводы
Мы представили **Self-Guided Action Diffusion**, новый эффективный подход к диффузионным политикам, который позволяет достигать высоких успешных результатов с мини
Abstract
Recent works have shown the promise of inference-time search over action
samples for improving generative robot policies. In particular, optimizing
cross-chunk coherence via bidirectional decoding has proven effective in
boosting the consistency and reactivity of diffusion policies. However, this
approach remains computationally expensive as the diversity of sampled actions
grows. In this paper, we introduce self-guided action diffusion, a more
efficient variant of bidirectional decoding tailored for diffusion-based
policies. At the core of our method is to guide the proposal distribution at
each diffusion step based on the prior decision. Experiments in simulation
tasks show that the proposed self-guidance enables near-optimal performance at
negligible inference cost. Notably, under a tight sampling budget, our method
achieves up to 70% higher success rates than existing counterparts on
challenging dynamic tasks. See project website at
https://rhea-mal.github.io/selfgad.github.io.
Ссылки и действия
Дополнительные ресурсы: