Explainable Attention-Guided Stacked Graph Neural Networks for Malware Detection
2508.09801v2
cs.CR, cs.AI
2025-08-18
Авторы:
Hossein Shokouhinejad, Roozbeh Razavi-Far, Griffin Higgins, Ali A Ghorbani
Резюме на русском
## Контекст
Modern computing environments становятся все более уязвимыми перед различными видами малварного воздействия. Для эффективного управления этими угрозами необходимо разработать модели, которые не только обеспечивают высокую точность детекции, но и обладают интерпретируемым принципом работы. Данная задача приобретает особое значение в высококритичных ситуациях, таких как защита системы от вирусов или вредоносных программ, где любая неточность может привести к серьезным последствиям.
В настоящее время существуют различные подходы к детекции вредоносных программ, включая анализ поведения, текстовый анализ и модели статистической обработки. Однако, многие из этих моделей либо недостаточно точны, либо не имеют возможности пояснения своих решений. Это отступление от идеи "транспарентной" модели может ограничить их применение в реальных условиях, где понимание принципов принятия решений критично.
В этом контексте рассматривается задача разработки модели, которая не только позволяет эффективно детектировать вредоносные программы, но и обеспечивает понятные для пользователя пояснения своих решений.
## Метод
Для достижения этих целей предлагается использовать **Stacked Graph Neural Networks (SGNN)**. За основу взяты **Control Flow Graphs (CFGs)**, графы, описывающие поток управления в программе. Эти графы используются для представления структуры программы, что позволяет моделировать зависимости между ее частями.
**Процесс работы SGNN** можно разделить на несколько этапов. Сначала, из PE-файлов извлекаются CFGs, которые затем преобразуются в векторное представление с помощью **two-step embedding strategy**. Это позволяет передать в модель не только информацию о структуре программы, но и поведенческие характеристики.
Для увеличения разнообразия и улучшения точности модели, используется **ensemble-based approach**. В этом подходе используются несколько графовых нейронных сетей, каждая из которых применяет свой собственный механизм **message-passing** для извлечения различных видов функциональных признаков.
**Meta-learner**, реализованный в виде **attention-based multilayer perceptron (MLP)**, агрегирует выходные данные этих моделей. Эта агрегация позволяет не только улучшить точность классификации, но и определить вклад каждой модели в общий результат.
Для улучшения интерпретируемости решений, вводится **ensemble-aware post-hoc explanation technique**, которая использует **edge-level importance scores**, сгенерированные GNN-explainer, и объединяет их с помощью **attention weights**. Это позволяет получать понятные пользователю интерпретации решений, отражающие роль каждого компонента в общем процессе.
## Результаты
Для проверки эффективности SGNN были проведены эксперименты на наборе данных, содержащих PE-файлы с вредоносными
Abstract
Malware detection in modern computing environments demands models that are
not only accurate but also interpretable and robust to evasive techniques.
Graph neural networks (GNNs) have shown promise in this domain by modeling rich
structural dependencies in graph-based program representations such as control
flow graphs (CFGs). However, single-model approaches may suffer from limited
generalization and lack interpretability, especially in high-stakes security
applications. In this paper, we propose a novel stacking ensemble framework for
graph-based malware detection and explanation. Our method dynamically extracts
CFGs from portable executable (PE) files and encodes their basic blocks through
a two-step embedding strategy. A set of diverse GNN base learners, each with a
distinct message-passing mechanism, is used to capture complementary behavioral
features. Their prediction outputs are aggregated by a meta-learner implemented
as an attention-based multilayer perceptron, which both classifies malware
instances and quantifies the contribution of each base model. To enhance
explainability, we introduce an ensemble-aware post-hoc explanation technique
that leverages edge-level importance scores generated by a GNN explainer and
fuses them using the learned attention weights. This produces interpretable,
model-agnostic explanations aligned with the final ensemble decision.
Experimental results demonstrate that our framework improves classification
performance while providing insightful interpretations of malware behavior.
Ссылки и действия
Дополнительные ресурсы: