An Uncertainty-Weighted Decision Transformer for Navigation in Dense, Complex Driving Scenarios

2509.13132v1 cs.RO, cs.AI 2025-09-18
Авторы:

Zhihao Zhang, Chengyang Peng, Minghao Zhu, Ekim Yurtsever, Keith A. Redmill

Резюме на русском

#### Контекст Автоматическое управление транспортом в тяжелых и динамичных средах требует систем управления, которые могут эффективно использовать информацию о пространстве и длинных хронологических зависимостях, независимо от вероятностных ошибок. Одна из сложных задач — верная навигация в круговых маршрутах (раундаботы), где требуется комплексное объединение локальных стратегий и дальноводных планов. Данная работа призвана развить новую модель, которая бы придала уверенность и эффективность тактического управления в таких средах. #### Метод Предлагаемая модель, **Uncertainty-Weighted Decision Transformer (UWDT)**, сочетает в себе круговые схемы видимости (bird's-eye-view occupancy grids) с моделями последовательного моделирования, основанными на трансформерах. Основным инновационным аспектом является введение механизма, при котором железная модель (teacher) вычисляет показатель энтропии для каждого кванта (токена), который затем используется в тренируемой модели (student) для взвешивания ошибок в процессе обучения. Этот подход создает усиление обучения на более неуверенных, но важных для безопасности состояниях, не нарушая устойчивости модели в более частых, но менее критичных ситуациях. #### Результаты Эксперименты проводились в симуляторе раундаботов, где были использованы различные степени загруженности трафика. Модель UWDT показала значительный выигрыш по отношению к конкурентам по таким показателям, как награда (reward), частота столкновений и стабильность поведения. Наибольшую эффективность UWDT проявила в ситуациях высокой загрузки трафика, где требуется максимальная точность и стабильность решений. #### Значимость Модель UWDT может быть применена в автономных системах управления транспортом, особенно в сложных и плотных городских средах. Ее преимущество заключается в улучшении оценки вероятностных состояний, что приводит к более надежным и эффективным решениям. Это открывает путь к более безопасному и производительному самоуправлению транспорта в трудных условиях. #### Выводы Результаты показывают, что **Uncertainty-Weighted Decision Transformer** является эффективным инструментом для решения проблем неопределенности и неоднородности в задачах автономного управления транспортом. Будущие исследования будут сконцентрированы на расширении модели для других видов сложных сценариев и улучшении ее универсальности в различных условиях движения.

Abstract

Autonomous driving in dense, dynamic environments requires decision-making systems that can exploit both spatial structure and long-horizon temporal dependencies while remaining robust to uncertainty. This work presents a novel framework that integrates multi-channel bird's-eye-view occupancy grids with transformer-based sequence modeling for tactical driving in complex roundabout scenarios. To address the imbalance between frequent low-risk states and rare safety-critical decisions, we propose the Uncertainty-Weighted Decision Transformer (UWDT). UWDT employs a frozen teacher transformer to estimate per-token predictive entropy, which is then used as a weight in the student model's loss function. This mechanism amplifies learning from uncertain, high-impact states while maintaining stability across common low-risk transitions. Experiments in a roundabout simulator, across varying traffic densities, show that UWDT consistently outperforms other baselines in terms of reward, collision rate, and behavioral stability. The results demonstrate that uncertainty-aware, spatial-temporal transformers can deliver safer and more efficient decision-making for autonomous driving in complex traffic environments.

Ссылки и действия