Vision-Based Driver Drowsiness Monitoring: Comparative Analysis of YOLOv5-v11 Models

2509.17498v1 cs.CV, eess.IV 2025-09-24
Авторы:

Dilshara Herath, Chinthaka Abeyrathne, Prabhani Jayaweera

Резюме на русском

## Контекст Дремотонность водителей остается критическим фактором в транспортных происшествиях, приводя к тысячам смертей и травм ежегодно. Это исследование сосредотачивается на разработке реального времени, неинтрузивных методов детекции дремотонности водителей с использованием компьютерного зрения. Одной из наиболее эффективных технологий в этой области являются YOLO (You Only Look Once) алгоритмы. Они используются для периодического мониторинга состояния водителей и угадывания потенциальных сигналов усталости. Несмотря на их прогресс, существуют проблемы, такие как низкая точность, высокая задержка, высокое потребление ресурсов и нехватка широкого анализа вариаций внешнего вида, таких как позы, освещение или наличие очков. Это делает необходимым поиск более эффективных решений для обеспечения безопасности на дорогах. ## Метод Для решения этой проблемы был проведен подробный анализ различных модификаций YOLO, а именно YOLOv5-v11. Алгоритмы были применены к общедоступной базе данных UTA-RLDD, которая включает в себя разнообразные условия — пол, очки, свет и тональность кожи. Метрики оценки включали точность (Precision), восстановление (Recall), mAP (Mean Average Precision) с порогом 0.5 и комплексный порог от 0.5 до 0.95. Обучение и тестирование проводились с использованием различных параметров, включая разные глубины моделей (small, large) и типы сетей. Также была реализована модель Eye Aspect Ratio (EAR) на основе лицевых точек Dlib, для сравнения производительности с YOLO. ## Результаты Проведенный эксперимент показал, что YOLOv9c демонстрирует высокую точность (mAP 0.5: 0.986, Recall: 0.978), но требует большего объема ресурсов. С другой стороны, YOLOv11n демонстрирует более оптимальную связку между точностью (mAP 0.5: 0.954) и производительностью, что делает его пригодным для применения в устройствах с ограниченными ресурсами. Модель EAR, хотя и эффективна с точки зрения вычислительных затрат, оказалась менее устойчивой к переменным условиям, таким как позы и освещение. Это свидетельствует о том, что YOLOv11n может быть использовано для реального времени приложений, таких как автомобили с поддержкой драйверского мониторинга. ## Значимость Результаты имеют значительное значение для разработки систем безопасности в автомобильной и промышленной сфере. Использование YOLOv11n обеспечивает более быструю реакцию и меньшее потребление ресурсов, что важно для внедрения в системы автоматического управления. Этот алгоритм может использоваться не только для мониторинга водителей, но также для распознавания других объектов в раз

Abstract

Driver drowsiness remains a critical factor in road accidents, accounting for thousands of fatalities and injuries each year. This paper presents a comprehensive evaluation of real-time, non-intrusive drowsiness detection methods, focusing on computer vision based YOLO (You Look Only Once) algorithms. A publicly available dataset namely, UTA-RLDD was used, containing both awake and drowsy conditions, ensuring variability in gender, eyewear, illumination, and skin tone. Seven YOLO variants (v5s, v9c, v9t, v10n, v10l, v11n, v11l) are fine-tuned, with performance measured in terms of Precision, Recall, mAP0.5, and mAP 0.5-0.95. Among these, YOLOv9c achieved the highest accuracy (0.986 mAP 0.5, 0.978 Recall) while YOLOv11n strikes the optimal balance between precision (0.954) and inference efficiency, making it highly suitable for embedded deployment. Additionally, we implement an Eye Aspect Ratio (EAR) approach using Dlib's facial landmarks, which despite its low computational footprint exhibits reduced robustness under pose variation and occlusions. Our findings illustrate clear trade offs between accuracy, latency, and resource requirements, and offer practical guidelines for selecting or combining detection methods in autonomous driving and industrial safety applications.

Ссылки и действия