Towards Quantum Machine Learning for Malicious Code Analysis

2508.19381v1 cs.LG, cs.CR 2025-08-30
Авторы:

Jesus Lopez, Saeefa Rubaiyet Nowmi, Viviana Cadena, Mohammad Saidur Rahman

Резюме на русском

## Контекст Классическая машинная обучение (CML) долгое время используется для классификации вредоносных программ (малвирусов). Однако в последнее время возникла возможность использования квантовых вычислений в области машинного обучения (QML). Это открывает новые перспективы для улучшения методов обнаружения вредоносных программ. Несмотря на то, что QML пока не был широко использован в этой области, его потенциал в выявлении малвирусов очевиден. Целью данного исследования является исследование гибридных квантово-классических моделей QML для классификации вредоносных программ и оценка их эффективности. ## Метод Для решения задачи классификации вредоносных программ были рассмотрены два гибридных модели QML: Quantum Multilayer Perceptron (QMLP) и Quantum Convolutional Neural Network (QCNN). Оба модели используют квантовые стэйты для представления данных. QMLP включает в себя полное измерение кубитов и данные переобучения, что позволяет ему лучше обнаруживать сложные шаблоны в данных. QCNN, напротив, использует квантовые свертки и квантовые операции для быстрого обучения, но при этом теряет часть точности. Модели были тестированы на пяти разных датасетах: API-Graph, EMBER-Domain, EMBER-Class, AZ-Domain и AZ-Class, для классификации в двух и многоклассовых задачах. ## Результаты Результаты экспериментов показали высокую точность классификации в режиме бинарной классификации: QMLP демонстрировал точность 95-96% на API-Graph, 91-92% на AZ-Domain, а QCNN — 77% на EMBER-Domain. В режиме многоклассовой классификации точность QMLP варьировалась от 91.6% до 95.7% на API-Graph, от 41.7% до 93.6% на AZ-Class, а QCNN показал результаты от 60.7% до 88.1% на EMBER-Class. QMLP, несмотря на более долгую скорость обучения, показал лучшие результаты в задачах многоклассовой классификации. QCNN, в свою очередь, демонстрировал более высокую эффективность обучения, но с меньшей точностью. ## Значимость Полученные результаты показывают, что QML может стать мощным инструментом для улучшения методов обнаружения вредоносных программ. QMLP может быть применен для решения задач многоклассовой классификации, где требуется высокая точность. QCNN, с другой стороны, может использоваться для быстрого обучения в задачах бинарной классификации. Эти модели могут быть применены в различных сферах безопасности, таких как мониторинг сетей, анализ трафика и защита от вредоносных программ. Будущие исследования могут направлены на улучшение точности QML-моделей, а также на их применение в реальных системах защиты от вредоносных программ. ## Выводы Это исследование демонстрирует потенциал квантовых моделей для улучшения методов обнаружения вредоно

Abstract

Classical machine learning (CML) has been extensively studied for malware classification. With the emergence of quantum computing, quantum machine learning (QML) presents a paradigm-shifting opportunity to improve malware detection, though its application in this domain remains largely unexplored. In this study, we investigate two hybrid quantum-classical models -- a Quantum Multilayer Perceptron (QMLP) and a Quantum Convolutional Neural Network (QCNN), for malware classification. Both models utilize angle embedding to encode malware features into quantum states. QMLP captures complex patterns through full qubit measurement and data re-uploading, while QCNN achieves faster training via quantum convolution and pooling layers that reduce active qubits. We evaluate both models on five widely used malware datasets -- API-Graph, EMBER-Domain, EMBER-Class, AZ-Domain, and AZ-Class, across binary and multiclass classification tasks. Our results show high accuracy for binary classification -- 95-96% on API-Graph, 91-92% on AZ-Domain, and 77% on EMBER-Domain. In multiclass settings, accuracy ranges from 91.6-95.7% on API-Graph, 41.7-93.6% on AZ-Class, and 60.7-88.1% on EMBER-Class. Overall, QMLP outperforms QCNN in complex multiclass tasks, while QCNN offers improved training efficiency at the cost of reduced accuracy.

Ссылки и действия