An Uncertainty-Weighted Decision Transformer for Navigation in Dense, Complex Driving Scenarios
2509.13132v1
cs.RO, cs.AI
2025-09-18
Авторы:
Zhihao Zhang, Chengyang Peng, Minghao Zhu, Ekim Yurtsever, Keith A. Redmill
Резюме на русском
#### Контекст
Автоматическое управление транспортом в тяжелых и динамичных средах требует систем управления, которые могут эффективно использовать информацию о пространстве и длинных хронологических зависимостях, независимо от вероятностных ошибок. Одна из сложных задач — верная навигация в круговых маршрутах (раундаботы), где требуется комплексное объединение локальных стратегий и дальноводных планов. Данная работа призвана развить новую модель, которая бы придала уверенность и эффективность тактического управления в таких средах.
#### Метод
Предлагаемая модель, **Uncertainty-Weighted Decision Transformer (UWDT)**, сочетает в себе круговые схемы видимости (bird's-eye-view occupancy grids) с моделями последовательного моделирования, основанными на трансформерах. Основным инновационным аспектом является введение механизма, при котором железная модель (teacher) вычисляет показатель энтропии для каждого кванта (токена), который затем используется в тренируемой модели (student) для взвешивания ошибок в процессе обучения. Этот подход создает усиление обучения на более неуверенных, но важных для безопасности состояниях, не нарушая устойчивости модели в более частых, но менее критичных ситуациях.
#### Результаты
Эксперименты проводились в симуляторе раундаботов, где были использованы различные степени загруженности трафика. Модель UWDT показала значительный выигрыш по отношению к конкурентам по таким показателям, как награда (reward), частота столкновений и стабильность поведения. Наибольшую эффективность UWDT проявила в ситуациях высокой загрузки трафика, где требуется максимальная точность и стабильность решений.
#### Значимость
Модель UWDT может быть применена в автономных системах управления транспортом, особенно в сложных и плотных городских средах. Ее преимущество заключается в улучшении оценки вероятностных состояний, что приводит к более надежным и эффективным решениям. Это открывает путь к более безопасному и производительному самоуправлению транспорта в трудных условиях.
#### Выводы
Результаты показывают, что **Uncertainty-Weighted Decision Transformer** является эффективным инструментом для решения проблем неопределенности и неоднородности в задачах автономного управления транспортом. Будущие исследования будут сконцентрированы на расширении модели для других видов сложных сценариев и улучшении ее универсальности в различных условиях движения.
Abstract
Autonomous driving in dense, dynamic environments requires decision-making
systems that can exploit both spatial structure and long-horizon temporal
dependencies while remaining robust to uncertainty. This work presents a novel
framework that integrates multi-channel bird's-eye-view occupancy grids with
transformer-based sequence modeling for tactical driving in complex roundabout
scenarios. To address the imbalance between frequent low-risk states and rare
safety-critical decisions, we propose the Uncertainty-Weighted Decision
Transformer (UWDT). UWDT employs a frozen teacher transformer to estimate
per-token predictive entropy, which is then used as a weight in the student
model's loss function. This mechanism amplifies learning from uncertain,
high-impact states while maintaining stability across common low-risk
transitions. Experiments in a roundabout simulator, across varying traffic
densities, show that UWDT consistently outperforms other baselines in terms of
reward, collision rate, and behavioral stability. The results demonstrate that
uncertainty-aware, spatial-temporal transformers can deliver safer and more
efficient decision-making for autonomous driving in complex traffic
environments.
Ссылки и действия
Дополнительные ресурсы: