A Comparative Analysis of Ensemble-Based Machine Learning Approaches with Explainable AI for Multi-Class Intrusion Detection in Drone Networks
2509.20391v1
cs.CR, cs.LG
2025-09-27
Авторы:
Md. Alamgir Hossain, Waqas Ishtiaq, Md. Samiul Islam
Резюме на русском
## Контекст
Современная интеграция дронов в различные сферы, включая гражданскую, коммерческую и военную сферы, приводит к возрастающему риску сетевых атак, нацеленных на уязвимые протоколы связи дронов. Эти атаки могут привести к серьезным последствиям, включая уголовные действия, потерю конфиденциальности и даже риск травматических исходов в случае негативного воздействия на дроны. Одним из ключевых аспектов защиты дронов является разработка эффективных системм обнаружения и классификации широкого спектра атак, от спуфинга до MITM (man-in-the-middle). Дополнительно, в сфере защиты дронов необходимо обеспечить достаточную ясность интерпретации результатов моделей, чтобы модели могли использоваться в реальном времени и для критичных задач безопасности.
## Метод
Чтобы решить эту проблему, разработана система, основанная на машинном обучении с комбинацией множества моделей, таких как Random Forest, Extra Trees, AdaBoost, CatBoost, и XGBoost. Эти модели обучались на огромном датасете с множеством классов, включая обычный трафик и множество типов нарушений. Для обработки данных применялись методы, такие как импутация пропущенных значений, масштабирование, и категориальное кодирование. Также, для глубжей интерпретации результатов использовались технологии explainable AI, такие как SHAP (SHapley Additive exPlanations) и LIME (Local Interpretable Model-agnostic Explanations). Методы эти позволили получить дополнительные понятные причины для каждого классификационного результата.
## Результаты
Проведенные эксперименты показали, что Random Forest демонстрирует наилучшие результаты с macro F1-score почти 1.0 (0.9998) и ROC AUC 1.0 (1.0000). Другие модели тоже показали высокую точность, но не достигли таких высоких результатов. Для проверки влияния статистически значимых различий между моделями, применены тесты, такие как Friedmans test и Wilcoxon signed-rank test. Также, использование explainable AI позволило получить понятные обоснования решений модели, что улучшило ее доверительность и полезность в критически важных задачах.
## Значимость
Разработанная модель показала себя как высокоточная и интерпретируемая система для обнаружения и классификации нарушений в сетях дронов. Это делает ее подходящей для реального времени и для задач, требующих высокой надежности, таких как защита критически важных систем связи дронов. Эта модель может быть применена в различных сферах, включая защиту гражданских и военных сетей, а также в задаче анализа данных в сфере цифровой безопасности.
## Выводы
Предложенный подход обеспечил высокую точность и ясность решений, установив новый стандарт для обнаружения нарушений в сетях дронов. Буду
Abstract
The growing integration of drones into civilian, commercial, and defense
sectors introduces significant cybersecurity concerns, particularly with the
increased risk of network-based intrusions targeting drone communication
protocols. Detecting and classifying these intrusions is inherently challenging
due to the dynamic nature of drone traffic and the presence of multiple
sophisticated attack vectors such as spoofing, injection, replay, and
man-in-the-middle (MITM) attacks. This research aims to develop a robust and
interpretable intrusion detection framework tailored for drone networks, with a
focus on handling multi-class classification and model explainability. We
present a comparative analysis of ensemble-based machine learning models,
namely Random Forest, Extra Trees, AdaBoost, CatBoost, and XGBoost, trained on
a labeled dataset comprising benign traffic and nine distinct intrusion types.
Comprehensive data preprocessing was performed, including missing value
imputation, scaling, and categorical encoding, followed by model training and
extensive evaluation using metrics such as macro F1-score, ROC AUC, Matthews
Correlation Coefficient, and Log Loss. Random Forest achieved the highest
performance with a macro F1-score of 0.9998 and ROC AUC of 1.0000. To validate
the superiority of the models, statistical tests, including Friedmans test, the
Wilcoxon signed-rank test with Holm correction, and bootstrapped confidence
intervals, were applied. Furthermore, explainable AI methods, SHAP and LIME,
were integrated to interpret both global and local feature importance,
enhancing model transparency and decision trustworthiness. The proposed
approach not only delivers near-perfect accuracy but also ensures
interpretability, making it highly suitable for real-time and safety-critical
drone operations.
Ссылки и действия
Дополнительные ресурсы: