The Case for Negative Data: From Crash Reports to Counterfactuals for Reasonable Driving
2509.18626v1
cs.RO, cs.AI
2025-09-25
Авторы:
Jay Patrikar, Apoorva Sharma, Sushant Veer, Boyi Li, Sebastian Scherer, Marco Pavone
Резюме на русском
## Контекст
Улучшение безопасности автомобилей с помощью людских водителей требует понимания ситуаций, в которых могут произойти ошибки. Реальные случаи неудач отражают работу систем в крайних условиях, но трудно использовать их без структуры. Ограничения в обработке текстовых данных, таких как отчеты о крашах, приводят к неэффективности использования полезной информации. Эти проблемы могут стать причиной неточных решений в автономных системах. Наше исследование стремится решить эти проблемы, предложив новый подход для извлечения полезной информации из негативных данных, таких как отчеты о крашах. Целью является расширение подходов к обучению, чтобы они могли выносить более адекватные решения в крайних ситуациях.
## Метод
Мы предлагаем новую стратегию, основывающуюся на преобразовании текста отчетов о крашах в менее структурированную форму, которая легче позволяет проводить анализ. Данные преобразуются в сценарную активность, которая может быть использована для поиска соответствующих сценариев. Мы также предлагаем систему, которая использует эти сценарии для точных решений. Была разработана система, которая может анализировать прошлые случаи и поискать аналогичные в своем индексе. Эта система также может порождать контрфактовные сценарии, которые помогают рассмотреть варианты, которые могут быть более предпочтительны в определенных ситуациях.
## Результаты
Наши эксперименты проводились на базе данных nuScenes. Мы сравнили нашу систему с другими подходами и обнаружили, что она значительно улучшает калибровку решений. Например, реколл на контекстуально предпочтительные действия вырос от 24% до 53%. Кроме того, контрфактовная версия системы способна улучшить точность решений в крайних случаях. Это показывает, что наш подход не только улучшает качество решений, но и позволяет системе действовать более осторожно в критичных ситуациях.
## Значимость
Наш подход может быть применен в различных областях, где необходимо точно выносить решения на основе текстовых данных, таких как автомобильная индустрия, безопасность, юридические исследований. Он предоставляет новый способ работы с отчетами об ошибках и может помочь в развитии более безопасных автономных систем. Мы считаем, что наша работа делает видимым путь для будущих исследований в этой области и может стать основой для дальнейших разработок.
## Выводы
Мы сумели доказать, что преобразование текста отчетов о крашах в сценарную активность позволяет более эффективно использовать данные. Кроме того, наш контрфактовный подход дем
Abstract
Learning-based autonomous driving systems are trained mostly on incident-free
data, offering little guidance near safety-performance boundaries. Real crash
reports contain precisely the contrastive evidence needed, but they are hard to
use: narratives are unstructured, third-person, and poorly grounded to sensor
views. We address these challenges by normalizing crash narratives to
ego-centric language and converting both logs and crashes into a unified
scene-action representation suitable for retrieval. At decision time, our
system adjudicates proposed actions by retrieving relevant precedents from this
unified index; an agentic counterfactual extension proposes plausible
alternatives, retrieves for each, and reasons across outcomes before deciding.
On a nuScenes benchmark, precedent retrieval substantially improves
calibration, with recall on contextually preferred actions rising from 24% to
53%. The counterfactual variant preserves these gains while sharpening
decisions near risk.
Ссылки и действия
Дополнительные ресурсы: