Learning to Drive Ethically: Embedding Moral Reasoning into Autonomous Driving

2508.14926v1 cs.LG, cs.AI, cs.RO 2025-08-23
Авторы:

Dianzhao Li, Ostap Okhrin

Резюме на русском

#### Контекст Исследование рассматривает вопросы этического принятия решений в автономном вождении, что является ключевым фактором для успешного внедрения автономных транспортных систем. Несмотря на прогресс в области искусственного интеллекта и автоматизации, автомобили с автономным управлением сталкиваются с проблемами этики в сложных сценариях, таких как принятие моральных решений в ситуациях неопределенности или опасности. Эти проблемы приобретают большое значение для создания доверия к технологии, обеспечения соответствия законам и реализации безопасных, удовлетворительных для всех решений в транспортной системе. В статье предлагается новый подход к решению этой проблемы путем внедрения морального разума в автономное управление велосипедами и подобными активными системами. #### Метод Предлагаемая модель основывается на фреймворке Safe Reinforcement Learning (Safe RL), который сочетает моральные рассуждения с традиционными целями вождения, такими как безопасность и эффективность. На уровне принятия решений создана система, которая использует композитный этический кост, включающий в себя вероятность столкновения и серьезность последствий. Эта модель позволяет формировать высокоуровневые моторные цели, принимая во внимание этики. На уровне исполнения полиномиальные алгоритмы планирования пути и контроллеры Proportional-Integral-Derivative (PID) и Stanley используются для преобразования высокоуровневых моторных целей в рабочие пути. Для улучшения обучения используется динамическая механика Prioritized Experience Replay, которая повышает внимание к редким, но критичным ситуациям. #### Результаты Метод был тестирован на разнообразных реальных данных с высокой разнообразием транспортных средств, включая автомобили, велосипеды и пешеходов. Эксперименты проводились с помощью симуляторов и реальных экспериментов. Результаты показали, что подход эффективно решает проблему этического принятия решений, сокращая риск столкновений и повышая безопасность вождения. Особое внимание уделяется тому, что модель не только эффективно решает моральные задачи, но и сохраняет высокую производительность вождения. #### Значимость Предложенный подход имеет широкие потенциальные применения в области автономного транспорта, включая улучшение безопасности, соответствия нормам и удовлетворение моральных стандартов вождения. Одним из основных преимуществ является возможность обучения модели в реальных сценариях, что обеспечивает более точное и эффективное принятие решений. Этот подход может сыграть ключевую роль в ускорении внедрения автономных транспортных систем, обеспечивая их безо

Abstract

Autonomous vehicles hold great promise for reducing traffic fatalities and improving transportation efficiency, yet their widespread adoption hinges on embedding robust ethical reasoning into routine and emergency maneuvers. Here, we present a hierarchical Safe Reinforcement Learning (Safe RL) framework that explicitly integrates moral considerations with standard driving objectives. At the decision level, a Safe RL agent is trained using a composite ethical risk cost, combining collision probability and harm severity, to generate high-level motion targets. A dynamic Prioritized Experience Replay mechanism amplifies learning from rare but critical, high-risk events. At the execution level, polynomial path planning coupled with Proportional-Integral-Derivative (PID) and Stanley controllers translates these targets into smooth, feasible trajectories, ensuring both accuracy and comfort. We train and validate our approach on rich, real-world traffic datasets encompassing diverse vehicles, cyclists, and pedestrians, and demonstrate that it outperforms baseline methods in reducing ethical risk and maintaining driving performance. To our knowledge, this is the first study of ethical decision-making for autonomous vehicles via Safe RL in real-world scenarios. Our results highlight the potential of combining formal control theory and data-driven learning to advance ethically accountable autonomy in complex, human-mixed traffic environments.

Ссылки и действия