The Case for Negative Data: From Crash Reports to Counterfactuals for Reasonable Driving

2509.18626v1 cs.RO, cs.AI 2025-09-25
Авторы:

Jay Patrikar, Apoorva Sharma, Sushant Veer, Boyi Li, Sebastian Scherer, Marco Pavone

Резюме на русском

## Контекст Улучшение безопасности автомобилей с помощью людских водителей требует понимания ситуаций, в которых могут произойти ошибки. Реальные случаи неудач отражают работу систем в крайних условиях, но трудно использовать их без структуры. Ограничения в обработке текстовых данных, таких как отчеты о крашах, приводят к неэффективности использования полезной информации. Эти проблемы могут стать причиной неточных решений в автономных системах. Наше исследование стремится решить эти проблемы, предложив новый подход для извлечения полезной информации из негативных данных, таких как отчеты о крашах. Целью является расширение подходов к обучению, чтобы они могли выносить более адекватные решения в крайних ситуациях. ## Метод Мы предлагаем новую стратегию, основывающуюся на преобразовании текста отчетов о крашах в менее структурированную форму, которая легче позволяет проводить анализ. Данные преобразуются в сценарную активность, которая может быть использована для поиска соответствующих сценариев. Мы также предлагаем систему, которая использует эти сценарии для точных решений. Была разработана система, которая может анализировать прошлые случаи и поискать аналогичные в своем индексе. Эта система также может порождать контрфактовные сценарии, которые помогают рассмотреть варианты, которые могут быть более предпочтительны в определенных ситуациях. ## Результаты Наши эксперименты проводились на базе данных nuScenes. Мы сравнили нашу систему с другими подходами и обнаружили, что она значительно улучшает калибровку решений. Например, реколл на контекстуально предпочтительные действия вырос от 24% до 53%. Кроме того, контрфактовная версия системы способна улучшить точность решений в крайних случаях. Это показывает, что наш подход не только улучшает качество решений, но и позволяет системе действовать более осторожно в критичных ситуациях. ## Значимость Наш подход может быть применен в различных областях, где необходимо точно выносить решения на основе текстовых данных, таких как автомобильная индустрия, безопасность, юридические исследований. Он предоставляет новый способ работы с отчетами об ошибках и может помочь в развитии более безопасных автономных систем. Мы считаем, что наша работа делает видимым путь для будущих исследований в этой области и может стать основой для дальнейших разработок. ## Выводы Мы сумели доказать, что преобразование текста отчетов о крашах в сценарную активность позволяет более эффективно использовать данные. Кроме того, наш контрфактовный подход дем

Abstract

Learning-based autonomous driving systems are trained mostly on incident-free data, offering little guidance near safety-performance boundaries. Real crash reports contain precisely the contrastive evidence needed, but they are hard to use: narratives are unstructured, third-person, and poorly grounded to sensor views. We address these challenges by normalizing crash narratives to ego-centric language and converting both logs and crashes into a unified scene-action representation suitable for retrieval. At decision time, our system adjudicates proposed actions by retrieving relevant precedents from this unified index; an agentic counterfactual extension proposes plausible alternatives, retrieves for each, and reasons across outcomes before deciding. On a nuScenes benchmark, precedent retrieval substantially improves calibration, with recall on contextually preferred actions rising from 24% to 53%. The counterfactual variant preserves these gains while sharpening decisions near risk.

Ссылки и действия