Explainable Attention-Guided Stacked Graph Neural Networks for Malware Detection

2508.09801v2 cs.CR, cs.AI 2025-08-18
Авторы:

Hossein Shokouhinejad, Roozbeh Razavi-Far, Griffin Higgins, Ali A Ghorbani

Резюме на русском

## Контекст Modern computing environments становятся все более уязвимыми перед различными видами малварного воздействия. Для эффективного управления этими угрозами необходимо разработать модели, которые не только обеспечивают высокую точность детекции, но и обладают интерпретируемым принципом работы. Данная задача приобретает особое значение в высококритичных ситуациях, таких как защита системы от вирусов или вредоносных программ, где любая неточность может привести к серьезным последствиям. В настоящее время существуют различные подходы к детекции вредоносных программ, включая анализ поведения, текстовый анализ и модели статистической обработки. Однако, многие из этих моделей либо недостаточно точны, либо не имеют возможности пояснения своих решений. Это отступление от идеи "транспарентной" модели может ограничить их применение в реальных условиях, где понимание принципов принятия решений критично. В этом контексте рассматривается задача разработки модели, которая не только позволяет эффективно детектировать вредоносные программы, но и обеспечивает понятные для пользователя пояснения своих решений. ## Метод Для достижения этих целей предлагается использовать **Stacked Graph Neural Networks (SGNN)**. За основу взяты **Control Flow Graphs (CFGs)**, графы, описывающие поток управления в программе. Эти графы используются для представления структуры программы, что позволяет моделировать зависимости между ее частями. **Процесс работы SGNN** можно разделить на несколько этапов. Сначала, из PE-файлов извлекаются CFGs, которые затем преобразуются в векторное представление с помощью **two-step embedding strategy**. Это позволяет передать в модель не только информацию о структуре программы, но и поведенческие характеристики. Для увеличения разнообразия и улучшения точности модели, используется **ensemble-based approach**. В этом подходе используются несколько графовых нейронных сетей, каждая из которых применяет свой собственный механизм **message-passing** для извлечения различных видов функциональных признаков. **Meta-learner**, реализованный в виде **attention-based multilayer perceptron (MLP)**, агрегирует выходные данные этих моделей. Эта агрегация позволяет не только улучшить точность классификации, но и определить вклад каждой модели в общий результат. Для улучшения интерпретируемости решений, вводится **ensemble-aware post-hoc explanation technique**, которая использует **edge-level importance scores**, сгенерированные GNN-explainer, и объединяет их с помощью **attention weights**. Это позволяет получать понятные пользователю интерпретации решений, отражающие роль каждого компонента в общем процессе. ## Результаты Для проверки эффективности SGNN были проведены эксперименты на наборе данных, содержащих PE-файлы с вредоносными

Abstract

Malware detection in modern computing environments demands models that are not only accurate but also interpretable and robust to evasive techniques. Graph neural networks (GNNs) have shown promise in this domain by modeling rich structural dependencies in graph-based program representations such as control flow graphs (CFGs). However, single-model approaches may suffer from limited generalization and lack interpretability, especially in high-stakes security applications. In this paper, we propose a novel stacking ensemble framework for graph-based malware detection and explanation. Our method dynamically extracts CFGs from portable executable (PE) files and encodes their basic blocks through a two-step embedding strategy. A set of diverse GNN base learners, each with a distinct message-passing mechanism, is used to capture complementary behavioral features. Their prediction outputs are aggregated by a meta-learner implemented as an attention-based multilayer perceptron, which both classifies malware instances and quantifies the contribution of each base model. To enhance explainability, we introduce an ensemble-aware post-hoc explanation technique that leverages edge-level importance scores generated by a GNN explainer and fuses them using the learned attention weights. This produces interpretable, model-agnostic explanations aligned with the final ensemble decision. Experimental results demonstrate that our framework improves classification performance while providing insightful interpretations of malware behavior.

Ссылки и действия