A Comparative Analysis of Ensemble-Based Machine Learning Approaches with Explainable AI for Multi-Class Intrusion Detection in Drone Networks

2509.20391v1 cs.CR, cs.LG 2025-09-27
Авторы:

Md. Alamgir Hossain, Waqas Ishtiaq, Md. Samiul Islam

Резюме на русском

## Контекст Современная интеграция дронов в различные сферы, включая гражданскую, коммерческую и военную сферы, приводит к возрастающему риску сетевых атак, нацеленных на уязвимые протоколы связи дронов. Эти атаки могут привести к серьезным последствиям, включая уголовные действия, потерю конфиденциальности и даже риск травматических исходов в случае негативного воздействия на дроны. Одним из ключевых аспектов защиты дронов является разработка эффективных системм обнаружения и классификации широкого спектра атак, от спуфинга до MITM (man-in-the-middle). Дополнительно, в сфере защиты дронов необходимо обеспечить достаточную ясность интерпретации результатов моделей, чтобы модели могли использоваться в реальном времени и для критичных задач безопасности. ## Метод Чтобы решить эту проблему, разработана система, основанная на машинном обучении с комбинацией множества моделей, таких как Random Forest, Extra Trees, AdaBoost, CatBoost, и XGBoost. Эти модели обучались на огромном датасете с множеством классов, включая обычный трафик и множество типов нарушений. Для обработки данных применялись методы, такие как импутация пропущенных значений, масштабирование, и категориальное кодирование. Также, для глубжей интерпретации результатов использовались технологии explainable AI, такие как SHAP (SHapley Additive exPlanations) и LIME (Local Interpretable Model-agnostic Explanations). Методы эти позволили получить дополнительные понятные причины для каждого классификационного результата. ## Результаты Проведенные эксперименты показали, что Random Forest демонстрирует наилучшие результаты с macro F1-score почти 1.0 (0.9998) и ROC AUC 1.0 (1.0000). Другие модели тоже показали высокую точность, но не достигли таких высоких результатов. Для проверки влияния статистически значимых различий между моделями, применены тесты, такие как Friedmans test и Wilcoxon signed-rank test. Также, использование explainable AI позволило получить понятные обоснования решений модели, что улучшило ее доверительность и полезность в критически важных задачах. ## Значимость Разработанная модель показала себя как высокоточная и интерпретируемая система для обнаружения и классификации нарушений в сетях дронов. Это делает ее подходящей для реального времени и для задач, требующих высокой надежности, таких как защита критически важных систем связи дронов. Эта модель может быть применена в различных сферах, включая защиту гражданских и военных сетей, а также в задаче анализа данных в сфере цифровой безопасности. ## Выводы Предложенный подход обеспечил высокую точность и ясность решений, установив новый стандарт для обнаружения нарушений в сетях дронов. Буду

Abstract

The growing integration of drones into civilian, commercial, and defense sectors introduces significant cybersecurity concerns, particularly with the increased risk of network-based intrusions targeting drone communication protocols. Detecting and classifying these intrusions is inherently challenging due to the dynamic nature of drone traffic and the presence of multiple sophisticated attack vectors such as spoofing, injection, replay, and man-in-the-middle (MITM) attacks. This research aims to develop a robust and interpretable intrusion detection framework tailored for drone networks, with a focus on handling multi-class classification and model explainability. We present a comparative analysis of ensemble-based machine learning models, namely Random Forest, Extra Trees, AdaBoost, CatBoost, and XGBoost, trained on a labeled dataset comprising benign traffic and nine distinct intrusion types. Comprehensive data preprocessing was performed, including missing value imputation, scaling, and categorical encoding, followed by model training and extensive evaluation using metrics such as macro F1-score, ROC AUC, Matthews Correlation Coefficient, and Log Loss. Random Forest achieved the highest performance with a macro F1-score of 0.9998 and ROC AUC of 1.0000. To validate the superiority of the models, statistical tests, including Friedmans test, the Wilcoxon signed-rank test with Holm correction, and bootstrapped confidence intervals, were applied. Furthermore, explainable AI methods, SHAP and LIME, were integrated to interpret both global and local feature importance, enhancing model transparency and decision trustworthiness. The proposed approach not only delivers near-perfect accuracy but also ensures interpretability, making it highly suitable for real-time and safety-critical drone operations.

Ссылки и действия