Belief-Conditioned One-Step Diffusion: Real-Time Trajectory Planning with Just-Enough Sensing
2508.12166v1
cs.RO, cs.LG, cs.SY, eess.SY
2025-08-19
Авторы:
Gokul Puthumanaillam, Aditya Penumarti, Manav Vora, Paulo Padrao, Jose Fuentes, Leonardo Bobadilla, Jane Shin, Melkior Ornik
Резюме на русском
## Контекст
Увеличение числа различных задач, с которыми сталкиваются роботы в реальном мире, приводит к появлению сложных проблем, связанных с энергоэффективностью и эффективностью динамической планирования маршрутов. Роботы, оснащенные разнообразными сенсорами, могут стабильно определять свое положение в полу-обнаруживаемых окружениях. Однако продолжительное включение всех сенсоров одновременно является не только энергоемким, но и неэффективным. Обычно используются методы, ориентированные на моделях, которые обрабатывают беззнаковые области, но они требуют постоянного включения сенсоров, что приводит к большим расходам. Исследователи пытаются разработать более эффективные методы, которые позволят роботам выполнять задачи с минимальным потреблением ресурсов.
## Метод
Belief-Conditioned One-Step Diffusion (B-COD) — это планировщик, который способен в реальном времени выбирать минимальный набор сенсоров, необходимый для поддержания соответствующей расстояния позиционирования. Основная идея заключается в том, что данный планировщик способен вычислять расстояние до цели и прогнозировать распространение знаний о положении с помощью трех векторов: размера 10 метров, 10 миллисекунд и 10 терабайт. Метод использует распределенные сигналы, которые позволяют оптимизировать алгоритм для разных сценариев. Для улучшения достоверности решения используется метод прослойки размерности, который позволяет снизить количество вычислительных операций.
## Результаты
Исследователи проверили систему на нескольких сценариях, в том числе на плавающих лодках в реальном времени. Отчеты обозначают, что B-COD способен уменьшить потребление энергии сенсоров на 50% в сравнении с базовыми методами. Оно показало способность точно определять местоположение без необходимости всегда включать все сенсоры. Кроме того, B-COD позволяет выделить лучший путь во время выполнения задачи, что делает его оптимальным в технических и энергетических аспектах.
## Значимость
Этот подход может быть применен в различных областях, включая морские и авиационные операции, а также городские системы. Он позволяет экономить энергию, уменьшить время расчетов и обеспечить более точное навигационное положение. Благодаря своей гибкости, B-COD может быть усовершенствован для различных ситуаций и окружений, что делает его обширным инструментом для развития робототехники.
## Выводы
Результаты исследований B-COD показывают, что этот метод может стать новой стандартной платформой для реального времени роботов, выполняющих точные задачи. Несмотря на то, что он уже демо
Abstract
Robots equipped with rich sensor suites can localize reliably in
partially-observable environments, but powering every sensor continuously is
wasteful and often infeasible. Belief-space planners address this by
propagating pose-belief covariance through analytic models and switching
sensors heuristically--a brittle, runtime-expensive approach. Data-driven
approaches--including diffusion models--learn multi-modal trajectories from
demonstrations, but presuppose an accurate, always-on state estimate. We
address the largely open problem: for a given task in a mapped environment,
which \textit{minimal sensor subset} must be active at each location to
maintain state uncertainty \textit{just low enough} to complete the task? Our
key insight is that when a diffusion planner is explicitly conditioned on a
pose-belief raster and a sensor mask, the spread of its denoising trajectories
yields a calibrated, differentiable proxy for the expected localisation error.
Building on this insight, we present Belief-Conditioned One-Step Diffusion
(B-COD), the first planner that, in a 10 ms forward pass, returns a
short-horizon trajectory, per-waypoint aleatoric variances, and a proxy for
localisation error--eliminating external covariance rollouts. We show that this
single proxy suffices for a soft-actor-critic to choose sensors online,
optimising energy while bounding pose-covariance growth. We deploy B-COD in
real-time marine trials on an unmanned surface vehicle and show that it reduces
sensing energy consumption while matching the goal-reach performance of an
always-on baseline.