Belief-Conditioned One-Step Diffusion: Real-Time Trajectory Planning with Just-Enough Sensing

2508.12166v1 cs.RO, cs.LG, cs.SY, eess.SY 2025-08-19

Авторы:

Gokul Puthumanaillam, Aditya Penumarti, Manav Vora, Paulo Padrao, Jose Fuentes, Leonardo Bobadilla, Jane Shin, Melkior Ornik

Резюме на русском

## Контекст Увеличение числа различных задач, с которыми сталкиваются роботы в реальном мире, приводит к появлению сложных проблем, связанных с энергоэффективностью и эффективностью динамической планирования маршрутов. Роботы, оснащенные разнообразными сенсорами, могут стабильно определять свое положение в полу-обнаруживаемых окружениях. Однако продолжительное включение всех сенсоров одновременно является не только энергоемким, но и неэффективным. Обычно используются методы, ориентированные на моделях, которые обрабатывают беззнаковые области, но они требуют постоянного включения сенсоров, что приводит к большим расходам. Исследователи пытаются разработать более эффективные методы, которые позволят роботам выполнять задачи с минимальным потреблением ресурсов. ## Метод Belief-Conditioned One-Step Diffusion (B-COD) — это планировщик, который способен в реальном времени выбирать минимальный набор сенсоров, необходимый для поддержания соответствующей расстояния позиционирования. Основная идея заключается в том, что данный планировщик способен вычислять расстояние до цели и прогнозировать распространение знаний о положении с помощью трех векторов: размера 10 метров, 10 миллисекунд и 10 терабайт. Метод использует распределенные сигналы, которые позволяют оптимизировать алгоритм для разных сценариев. Для улучшения достоверности решения используется метод прослойки размерности, который позволяет снизить количество вычислительных операций. ## Результаты Исследователи проверили систему на нескольких сценариях, в том числе на плавающих лодках в реальном времени. Отчеты обозначают, что B-COD способен уменьшить потребление энергии сенсоров на 50% в сравнении с базовыми методами. Оно показало способность точно определять местоположение без необходимости всегда включать все сенсоры. Кроме того, B-COD позволяет выделить лучший путь во время выполнения задачи, что делает его оптимальным в технических и энергетических аспектах. ## Значимость Этот подход может быть применен в различных областях, включая морские и авиационные операции, а также городские системы. Он позволяет экономить энергию, уменьшить время расчетов и обеспечить более точное навигационное положение. Благодаря своей гибкости, B-COD может быть усовершенствован для различных ситуаций и окружений, что делает его обширным инструментом для развития робототехники. ## Выводы Результаты исследований B-COD показывают, что этот метод может стать новой стандартной платформой для реального времени роботов, выполняющих точные задачи. Несмотря на то, что он уже демо

Abstract

Robots equipped with rich sensor suites can localize reliably in partially-observable environments, but powering every sensor continuously is wasteful and often infeasible. Belief-space planners address this by propagating pose-belief covariance through analytic models and switching sensors heuristically--a brittle, runtime-expensive approach. Data-driven approaches--including diffusion models--learn multi-modal trajectories from demonstrations, but presuppose an accurate, always-on state estimate. We address the largely open problem: for a given task in a mapped environment, which \textit{minimal sensor subset} must be active at each location to maintain state uncertainty \textit{just low enough} to complete the task? Our key insight is that when a diffusion planner is explicitly conditioned on a pose-belief raster and a sensor mask, the spread of its denoising trajectories yields a calibrated, differentiable proxy for the expected localisation error. Building on this insight, we present Belief-Conditioned One-Step Diffusion (B-COD), the first planner that, in a 10 ms forward pass, returns a short-horizon trajectory, per-waypoint aleatoric variances, and a proxy for localisation error--eliminating external covariance rollouts. We show that this single proxy suffices for a soft-actor-critic to choose sensors online, optimising energy while bounding pose-covariance growth. We deploy B-COD in real-time marine trials on an unmanned surface vehicle and show that it reduces sensing energy consumption while matching the goal-reach performance of an always-on baseline.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Belief-Conditioned One-Step Diffusion: Real-Time Trajectory Planning with Just-Enough Sensing

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Constraint-Aware Reinforcement Learning via Adaptive Action Scaling

Stabilizing Humanoid Robot Trajectory Generation via Physics-Informed Learning a...

ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functi...

Prepare Before You Act: Learning From Humans to Rearrange Initial States

Adaptive Model-Predictive Control of a Soft Continuum Robot Using a Physics-Info...

Навигация