Towards Faithful Class-level Self-explainability in Graph Neural Networks by Subgraph Dependencies

2508.11513v1 cs.LG, cs.AI 2025-08-19
Авторы:

Fanzhen Liu, Xiaoxiao Ma, Jian Yang, Alsharif Abuadbba, Kristen Moore, Surya Nepal, Cecile Paris, Quan Z. Sheng, Jia Wu

Резюме на русском

#### Контекст Объяснимость графовых нейронных сетей (Graph Neural Networks, GNNs) является важной задачей для их безопасного и справедливого применения. Многие текущие подходы сосредоточены на формировании индивидуальных объяснений для каждого классифицированного объекта. Однако, значительное внимание уделяется необходимости разработки самообъясняющихся моделей, которые бы способствовали классному уровню объясняемости. Несмотря на то что некоторые работы предложили самообъясняющиеся GNNs, вырабатывающие классовые прототипы, они ограничены исключительно индивидуальным уровнем объяснения. Таким образом, неясно, являются ли эти прототипы значимыми для классов в целом. Наша мотивация заключается в разработке метода, который бы способствовал надежной и структурированной объясняемости на классовом уровне, включая мотивацию и эффективность такого подхода. #### Метод Мы предлагаем **GraphOracle**, новый фреймворк для самообъясняющихся GNN, который сочетает в себе классификатор GNN с сетью, описывающей структурно спарсеные подграфы, значимые для каждого класса. Этот фреймворк эффективно обучается при помощи интегрированного подхода, который фиксирует зависимости между графом, подграфами и классификацией. Мы предлагаем маскированную стратегию оценки, позволяющую проверить надежность классного уровня объяснений. В отличие от предыдущих подходов, включая ProtGNN и PGIB, GraphOracle использует легковесные случайные прогулки и энтропийно-регулируемую отборку подграфов, что делает его более эффективным и масштабируемым. #### Результаты Мы проводили эксперименты на нескольких различных графовых базах данных, включая DD, PROTEINS и IMDB-BINARY. Наши результаты показывают, что GraphOracle превосходит существующие методы, включая ProtGNN и PGIB, на показателях точности, вычислительной эффективности и способности формировать достоверные классно-уровневые объяснения. Мы также проводили эксперименты на предыдущих моделях, оценивая их достоверность на классном уровне, и показали, что GraphOracle значительно превосходит их в этой области. Было также проверено, что наша модель эффективно масштабируется на больших графах и требует меньшего вычислительного времени по сравнению с такими методами, как Monte Carlo Tree Search. #### Значимость Наш подход имеет широкие применения в областях, где требуется надежность и прозрачность моделей GNN, таких как моделирование биологических сетей, социальных сетей и анализ конкурентных процессов. Наши результаты показывают, что GraphOracle обеспечивает более высокую точность и эффективность при формировании классных

Abstract

Enhancing the interpretability of graph neural networks (GNNs) is crucial to ensure their safe and fair deployment. Recent work has introduced self-explainable GNNs that generate explanations as part of training, improving both faithfulness and efficiency. Some of these models, such as ProtGNN and PGIB, learn class-specific prototypes, offering a potential pathway toward class-level explanations. However, their evaluations focus solely on instance-level explanations, leaving open the question of whether these prototypes meaningfully generalize across instances of the same class. In this paper, we introduce GraphOracle, a novel self-explainable GNN framework designed to generate and evaluate class-level explanations for GNNs. Our model jointly learns a GNN classifier and a set of structured, sparse subgraphs that are discriminative for each class. We propose a novel integrated training that captures graph$\unicode{x2013}$subgraph$\unicode{x2013}$prediction dependencies efficiently and faithfully, validated through a masking-based evaluation strategy. This strategy enables us to retroactively assess whether prior methods like ProtGNN and PGIB deliver effective class-level explanations. Our results show that they do not. In contrast, GraphOracle achieves superior fidelity, explainability, and scalability across a range of graph classification tasks. We further demonstrate that GraphOracle avoids the computational bottlenecks of previous methods$\unicode{x2014}$like Monte Carlo Tree Search$\unicode{x2014}$by using entropy-regularized subgraph selection and lightweight random walk extraction, enabling faster and more scalable training. These findings position GraphOracle as a practical and principled solution for faithful class-level self-explainability in GNNs.

Ссылки и действия