Towards Quantum Machine Learning for Malicious Code Analysis
2508.19381v1
cs.LG, cs.CR
2025-08-30
Авторы:
Jesus Lopez, Saeefa Rubaiyet Nowmi, Viviana Cadena, Mohammad Saidur Rahman
Резюме на русском
## Контекст
Классическая машинная обучение (CML) долгое время используется для классификации вредоносных программ (малвирусов). Однако в последнее время возникла возможность использования квантовых вычислений в области машинного обучения (QML). Это открывает новые перспективы для улучшения методов обнаружения вредоносных программ. Несмотря на то, что QML пока не был широко использован в этой области, его потенциал в выявлении малвирусов очевиден. Целью данного исследования является исследование гибридных квантово-классических моделей QML для классификации вредоносных программ и оценка их эффективности.
## Метод
Для решения задачи классификации вредоносных программ были рассмотрены два гибридных модели QML: Quantum Multilayer Perceptron (QMLP) и Quantum Convolutional Neural Network (QCNN). Оба модели используют квантовые стэйты для представления данных. QMLP включает в себя полное измерение кубитов и данные переобучения, что позволяет ему лучше обнаруживать сложные шаблоны в данных. QCNN, напротив, использует квантовые свертки и квантовые операции для быстрого обучения, но при этом теряет часть точности. Модели были тестированы на пяти разных датасетах: API-Graph, EMBER-Domain, EMBER-Class, AZ-Domain и AZ-Class, для классификации в двух и многоклассовых задачах.
## Результаты
Результаты экспериментов показали высокую точность классификации в режиме бинарной классификации: QMLP демонстрировал точность 95-96% на API-Graph, 91-92% на AZ-Domain, а QCNN — 77% на EMBER-Domain. В режиме многоклассовой классификации точность QMLP варьировалась от 91.6% до 95.7% на API-Graph, от 41.7% до 93.6% на AZ-Class, а QCNN показал результаты от 60.7% до 88.1% на EMBER-Class. QMLP, несмотря на более долгую скорость обучения, показал лучшие результаты в задачах многоклассовой классификации. QCNN, в свою очередь, демонстрировал более высокую эффективность обучения, но с меньшей точностью.
## Значимость
Полученные результаты показывают, что QML может стать мощным инструментом для улучшения методов обнаружения вредоносных программ. QMLP может быть применен для решения задач многоклассовой классификации, где требуется высокая точность. QCNN, с другой стороны, может использоваться для быстрого обучения в задачах бинарной классификации. Эти модели могут быть применены в различных сферах безопасности, таких как мониторинг сетей, анализ трафика и защита от вредоносных программ. Будущие исследования могут направлены на улучшение точности QML-моделей, а также на их применение в реальных системах защиты от вредоносных программ.
## Выводы
Это исследование демонстрирует потенциал квантовых моделей для улучшения методов обнаружения вредоно
Abstract
Classical machine learning (CML) has been extensively studied for malware
classification. With the emergence of quantum computing, quantum machine
learning (QML) presents a paradigm-shifting opportunity to improve malware
detection, though its application in this domain remains largely unexplored. In
this study, we investigate two hybrid quantum-classical models -- a Quantum
Multilayer Perceptron (QMLP) and a Quantum Convolutional Neural Network (QCNN),
for malware classification. Both models utilize angle embedding to encode
malware features into quantum states. QMLP captures complex patterns through
full qubit measurement and data re-uploading, while QCNN achieves faster
training via quantum convolution and pooling layers that reduce active qubits.
We evaluate both models on five widely used malware datasets -- API-Graph,
EMBER-Domain, EMBER-Class, AZ-Domain, and AZ-Class, across binary and
multiclass classification tasks.
Our results show high accuracy for binary classification -- 95-96% on
API-Graph, 91-92% on AZ-Domain, and 77% on EMBER-Domain. In multiclass
settings, accuracy ranges from 91.6-95.7% on API-Graph, 41.7-93.6% on AZ-Class,
and 60.7-88.1% on EMBER-Class. Overall, QMLP outperforms QCNN in complex
multiclass tasks, while QCNN offers improved training efficiency at the cost of
reduced accuracy.
Ссылки и действия
Дополнительные ресурсы: