Exploring multimodal implicit behavior learning for vehicle navigation in simulated cities
2509.15400v1
cs.LG, cs.AI, cs.RO
2025-09-22
Авторы:
Eric Aislan Antonelo, Gustavo Claudio Karl Couto, Christian Möller
Резюме на русском
#### Контекст
Исследование посвящено расширению возможностей Behavior Cloning (BC) в задачах навигации виртуальных автомобилей в симулированных городах. Стандартный BC сталкивается с проблемой невозможности правильно обучаться на многомодальных решениях, когда несколько действий могут быть верными для одной и той же ситуации. Это проблема становится актуальной при разработке интеллектуальных систем, которые должны принимать решения в сложных средах. Наше исследование стремится развить эффективные методы для обучения многомодальных моделей на основе Implicit Behavioral Cloning (IBC) с использованием Energy-Based Models (EBMs).
#### Метод
Для решения проблемы многомодальности применяется методология Implicit Behavioral Cloning с использованием Energy-Based Models. Мы предлагаем Data-Augmented IBC (DA-IBC), в рамках которого предлагается модифицировать экспертные действия, формируя counterexamples для более точного обучения. Для повышения точности используется усовершенствованная инициализация для наивныхх способов вывода, не требующих частных производных. Архитектура DA-IBC включает в себя энергетические модели для представления динамики действий и методы интерполяции для улучшения обучения. Эксперименты проводятся в симуляторе CARLA с использованием Bird's-Eye View данных, что позволяет эффективно оценивать качество навигационных решений.
#### Результаты
В ходе экспериментов продемонстрировано, что DA-IBC превосходит стандартный IBC в задачах многомодального обучения для городской навигации. Модель DA-IBC удается правильно представлять многомодальные распределения действий, что является ключевым преимуществом перед стандартным BC. Эксперименты показали, что процесс первичной инициализации и модификации экспертных действий значительно повышает точность и скорость обучения. Данные результаты подтвердят, что DA-IBC эффективно перехватывает комплексность многомодальных сценариев, делая его применимым в реальных ситуациях навигации.
#### Значимость
Результаты имеют большое значение для развития моделей, которые способны правильно обрабатывать многомодальные решения в задачах автоматизированной навигации. Такие модели могут быть применены в различных областях, включая автономную транспортную систему, системы поддержки принятия решений, а также в системы-роботы для автоматического управления транспортом. Основными преимуществами являются улучшенная точность и универсальность обучения, которые позволяют модели решать более сложные задачи. Будущие исследования будут сфокусированы на высшем качестве представления энергетических моделей и их расширении для более широких сценариев.
#### Выводы
DA-IBC демонстрирует существенное улучшение в обучении моделей, которые спосо
Abstract
Standard Behavior Cloning (BC) fails to learn multimodal driving decisions,
where multiple valid actions exist for the same scenario. We explore Implicit
Behavioral Cloning (IBC) with Energy-Based Models (EBMs) to better capture this
multimodality. We propose Data-Augmented IBC (DA-IBC), which improves learning
by perturbing expert actions to form the counterexamples of IBC training and
using better initialization for derivative-free inference. Experiments in the
CARLA simulator with Bird's-Eye View inputs demonstrate that DA-IBC outperforms
standard IBC in urban driving tasks designed to evaluate multimodal behavior
learning in a test environment. The learned energy landscapes are able to
represent multimodal action distributions, which BC fails to achieve.
Ссылки и действия
Дополнительные ресурсы: