DRIVE: Dynamic Rule Inference and Verified Evaluation for Constraint-Aware Autonomous Driving

2508.04066v1 cs.RO, cs.AI 2025-08-09
Авторы:

Longling Geng, Huangxing Li, Viktor Lado Naess, Mert Pilanci

Резюме на русском

## КОНТЕКСТ И ПРОБЛЕМАТИКА Автономная эксплуатация автомобилей представляет собой сложную задачу, требующую обеспечения безопасной и социально совместимой езды в разнообразных условиях. Одной из ключевых проблем в этой области является необходимость соблюдения мягких ограничений (soft constraints), таких как социальные нормы, предпочтения и контекстные факторы, которые часто неявны и трудно формализовать. Традиционные подходы к автономному управлению зависят от жестких предварительно заданных моделей ограничений или моделей, основанных исключительно на наградах, что может приводить к недостаточной адаптации к контексту или нарушениям социальных норм. Кроме того, существующие методы обучения ограничений часто не способны обеспечить проверяемость (verifiability) и объяснимость (explainability) решений, что является критическим для реального развертывания. Эти проблемы обостряются в ситуациях, характеризующихся высокой динамикой и разнообразием условий езды. Необходимо разработать фреймворк, который может динамически выучивать и соблюдать мягкие ограничения, обеспечивая при этом высокую точность, плавность траекторий и объяснимость решений. Целью данной работы является разработка фреймворка DRIVE, который решает эти проблемы, объединяя в себе динамическое обучение ограничений и проверяемый процесс принятия решений. ## ПРЕДЛОЖЕННЫЙ МЕТОД DRIVE предлагает инновационный фреймворк, который сочетает динамическое обучение мягких ограничений и проверяемую оптимизацию траекторий. Основные компоненты фреймворка включают: 1. **Динамическое обучение ограничений:** Используя моделирование вероятностного распределения вида exponential-family likelihood, DRIVE оценивает вероятность состояний переходов в зависимости от контекста езды. Это позволяет получить распределения мягких ограничений, которые адаптируются к конкретным ситуациям. 2. **Проверяемая оптимизация:** Изученные распределения ограничений интегрируются в модуль планирования, основанный на выпуклой оптимизации. Это гарантирует, что сгенерированные траектории не только физически выполнимы, но также соответствуют выученным предпочтениям. 3. **Объединение обучения и планирования:** В отличие от традиционных подходов, DRIVE тесно связывает процессы обучения ограничений и принятия решений, обеспечивая единый фреймворк для динамического анализа и выполнения. 4. **Проверка и объясняемость:** Фреймворк включает в себя механизмы проверки, которые подтверждают эффективность и надежность сгенерированных траекторий. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ DRIVE протестирован на крупномасштабных натуралистических данных о езде, включая наборы данных inD, highD и RoundD. Эти данные включают разнообразные сценарии езды, включая городские и междугородние условия. Фреймворк сравнивается с представительными базовыми методами, основанными на обратном обучении ограничений и моделях наград. Результаты показывают, что DRIVE достигает: - **Нулевой процент нарушений мягких ограничений (0.0% violation rate)**. - **Плавные и физически возможные траектории.** - **Лучшая Generalization по сравнению с базовыми методами.** Проверочные эксперименты также подтверждают высокую эффективность, объяснимость и надежность фреймворка. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ DRIVE имеет широкий спектр практических применений в области автономных транспортных систем. Он может быть использован для: - **Улучшения безопасности:** Нулевые нарушения мягких ограничений обеспечивают безопасность взаимодействия с другими участниками дорожного движения. - **Социальной совместимости:** Адаптация к предпочтениям и нормам поведения позволяет создать более естественные и человекоподобные траектории. - **Повышение надежности:** Высокая объяснимость и проверяемость делают DRIVE пригодным для реального развертывания в критических системах. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ Фреймворк DRIVE представляет собой важный шаг вперед в области автономного управления, объединяя динамическое обучение ограничений и проверяемую оптимизацию. Будущие исследования могут фокусироваться на расширении фреймворка для включения более сложных контекстов, таких как многоагентные взаимодействия и непредвиденные условия дорожного движения. Также возможно исследование применения DRIVE в других областях, требующих динамического обучения и проверяемых решений, таких как робототехника и интеллектуальные транспортные системы.

Abstract

Understanding and adhering to soft constraints is essential for safe and socially compliant autonomous driving. However, such constraints are often implicit, context-dependent, and difficult to specify explicitly. In this work, we present DRIVE, a novel framework for Dynamic Rule Inference and Verified Evaluation that models and evaluates human-like driving constraints from expert demonstrations. DRIVE leverages exponential-family likelihood modeling to estimate the feasibility of state transitions, constructing a probabilistic representation of soft behavioral rules that vary across driving contexts. These learned rule distributions are then embedded into a convex optimization-based planning module, enabling the generation of trajectories that are not only dynamically feasible but also compliant with inferred human preferences. Unlike prior approaches that rely on fixed constraint forms or purely reward-based modeling, DRIVE offers a unified framework that tightly couples rule inference with trajectory-level decision-making. It supports both data-driven constraint generalization and principled feasibility verification. We validate DRIVE on large-scale naturalistic driving datasets, including inD, highD, and RoundD, and benchmark it against representative inverse constraint learning and planning baselines. Experimental results show that DRIVE achieves 0.0% soft constraint violation rates, smoother trajectories, and stronger generalization across diverse driving scenarios. Verified evaluations further demonstrate the efficiency, explanability, and robustness of the framework for real-world deployment.

Ссылки и действия