Autoregressive End-to-End Planning with Time-Invariant Spatial Alignment and Multi-Objective Policy Refinement

2509.20938v1 cs.RO, cs.CV 2025-09-27

Авторы:

Jianbo Zhao, Taiyu Ban, Xiangjie Li, Xingtai Gui, Hangning Zhou, Lei Liu, Hongwei Zhao, Bin Li

Резюме на русском

#### Контекст Автономная планировка управления в системах автономного вождения требует эффективной интеграции сенсорных данных, предсказания будущих действий и соблюдения физических ограничений. Традиционные подходы часто сталкиваются с проблемами последовательности, требуя сложного предварительного симулирования сцены. Особенностью этой области является необходимость увеличения точности и реактивности планировщика, чтобы обеспечить безопасность и эффективность в тяжелой среде потока движения. Однако существующие решения часто страдают от проблем с адекватной расстановкой спацио-временных признаков и недостаточной оптимизации поведения в условиях сложности. #### Метод Мы предлагаем **Time-Invariant Spatial Alignment (TISA)** — модуль, который изменяет ориентацию сенсорных данных к автомобилю в каждый момент времени, сохраняя консистентность в пространственных признаках. Это позволяет избежать неполадок между прошлыми и будущими действиями. Для физически возможных действий включен **kinematic action prediction head**. Для выполнения нескольких задач вместо одной целой задачи, мы представили **Multi-Objective Policy Refinement**, где Direct Preference Optimization (DPO) используется для точного корректирования поведения в зависимости от конкретных сценариев. #### Результаты Мы проводим эксперименты на NAVSIM — высокодостоверном датасете для тестирования планировщиков. Модель показала **89.8 PDMS**, став самой эффективной в своей категории. Особенно выдающимся показался TISA-модуль, который удалось уменьшить ошибки спацио-временной несовпаденности. Эксперименты со сценариями, требующими внимательной оценки поведения, такими как сложные маневры или высокоскоростные сценарии, подтвердили стабильность и точность полученных результатов. #### Значимость Наш подход может быть применен в системах автономного вождения для более точного и безопасного планирования движения. Он предлагает преимущества перед современными методами, такими как более гибкая обработка непредсказуемых сценариев и улучшенная адаптация к различным стилям вождения. Открытое применение этой модели может способствовать улучшению безопасности и эффективности в развитых системах автоматизированного управления. #### Выводы Мы установили новый переломный момент в развитии автоматизированных планировщиков, предлагая решение, которое устраняет ограничения в существующих подходах. Будущие исследования будут сфокусированы на повышении скорости вычислений, улучшении моделей в условиях реальных данных и функциональном расширении модели в различных типах транспортных средств.

Abstract

The inherent sequential modeling capabilities of autoregressive models make them a formidable baseline for end-to-end planning in autonomous driving. Nevertheless, their performance is constrained by a spatio-temporal misalignment, as the planner must condition future actions on past sensory data. This creates an inconsistent worldview, limiting the upper bound of performance for an otherwise powerful approach. To address this, we propose a Time-Invariant Spatial Alignment (TISA) module that learns to project initial environmental features into a consistent ego-centric frame for each future time step, effectively correcting the agent's worldview without explicit future scene prediction. In addition, we employ a kinematic action prediction head (i.e., acceleration and yaw rate) to ensure physically feasible trajectories. Finally, we introduce a multi-objective post-training stage using Direct Preference Optimization (DPO) to move beyond pure imitation. Our approach provides targeted feedback on specific driving behaviors, offering a more fine-grained learning signal than the single, overall objective used in standard DPO. Our model achieves a state-of-the-art 89.8 PDMS on the NAVSIM dataset among autoregressive models. The video document is available at https://tisa-dpo-e2e.github.io/.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Autoregressive End-to-End Planning with Time-Invariant Spatial Alignment and Multi-Objective Policy Refinement

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

From Generated Human Videos to Physically Plausible Robot Trajectories

Sign Language Recognition using Bidirectional Reservoir Computing

FOM-Nav: Frontier-Object Maps for Object Goal Navigation

Opening the Sim-to-Real Door for Humanoid Pixel-to-Action Policy Transfer

Estimation of Kinematic Motion from Dashcam Footage

Навигация