Towards Faithful Class-level Self-explainability in Graph Neural Networks by Subgraph Dependencies
2508.11513v1
cs.LG, cs.AI
2025-08-19
Авторы:
Fanzhen Liu, Xiaoxiao Ma, Jian Yang, Alsharif Abuadbba, Kristen Moore, Surya Nepal, Cecile Paris, Quan Z. Sheng, Jia Wu
Резюме на русском
#### Контекст
Объяснимость графовых нейронных сетей (Graph Neural Networks, GNNs) является важной задачей для их безопасного и справедливого применения. Многие текущие подходы сосредоточены на формировании индивидуальных объяснений для каждого классифицированного объекта. Однако, значительное внимание уделяется необходимости разработки самообъясняющихся моделей, которые бы способствовали классному уровню объясняемости. Несмотря на то что некоторые работы предложили самообъясняющиеся GNNs, вырабатывающие классовые прототипы, они ограничены исключительно индивидуальным уровнем объяснения. Таким образом, неясно, являются ли эти прототипы значимыми для классов в целом. Наша мотивация заключается в разработке метода, который бы способствовал надежной и структурированной объясняемости на классовом уровне, включая мотивацию и эффективность такого подхода.
#### Метод
Мы предлагаем **GraphOracle**, новый фреймворк для самообъясняющихся GNN, который сочетает в себе классификатор GNN с сетью, описывающей структурно спарсеные подграфы, значимые для каждого класса. Этот фреймворк эффективно обучается при помощи интегрированного подхода, который фиксирует зависимости между графом, подграфами и классификацией. Мы предлагаем маскированную стратегию оценки, позволяющую проверить надежность классного уровня объяснений. В отличие от предыдущих подходов, включая ProtGNN и PGIB, GraphOracle использует легковесные случайные прогулки и энтропийно-регулируемую отборку подграфов, что делает его более эффективным и масштабируемым.
#### Результаты
Мы проводили эксперименты на нескольких различных графовых базах данных, включая DD, PROTEINS и IMDB-BINARY. Наши результаты показывают, что GraphOracle превосходит существующие методы, включая ProtGNN и PGIB, на показателях точности, вычислительной эффективности и способности формировать достоверные классно-уровневые объяснения. Мы также проводили эксперименты на предыдущих моделях, оценивая их достоверность на классном уровне, и показали, что GraphOracle значительно превосходит их в этой области. Было также проверено, что наша модель эффективно масштабируется на больших графах и требует меньшего вычислительного времени по сравнению с такими методами, как Monte Carlo Tree Search.
#### Значимость
Наш подход имеет широкие применения в областях, где требуется надежность и прозрачность моделей GNN, таких как моделирование биологических сетей, социальных сетей и анализ конкурентных процессов. Наши результаты показывают, что GraphOracle обеспечивает более высокую точность и эффективность при формировании классных
Abstract
Enhancing the interpretability of graph neural networks (GNNs) is crucial to
ensure their safe and fair deployment. Recent work has introduced
self-explainable GNNs that generate explanations as part of training, improving
both faithfulness and efficiency. Some of these models, such as ProtGNN and
PGIB, learn class-specific prototypes, offering a potential pathway toward
class-level explanations. However, their evaluations focus solely on
instance-level explanations, leaving open the question of whether these
prototypes meaningfully generalize across instances of the same class. In this
paper, we introduce GraphOracle, a novel self-explainable GNN framework
designed to generate and evaluate class-level explanations for GNNs. Our model
jointly learns a GNN classifier and a set of structured, sparse subgraphs that
are discriminative for each class. We propose a novel integrated training that
captures graph$\unicode{x2013}$subgraph$\unicode{x2013}$prediction dependencies
efficiently and faithfully, validated through a masking-based evaluation
strategy. This strategy enables us to retroactively assess whether prior
methods like ProtGNN and PGIB deliver effective class-level explanations. Our
results show that they do not. In contrast, GraphOracle achieves superior
fidelity, explainability, and scalability across a range of graph
classification tasks. We further demonstrate that GraphOracle avoids the
computational bottlenecks of previous methods$\unicode{x2014}$like Monte Carlo
Tree Search$\unicode{x2014}$by using entropy-regularized subgraph selection and
lightweight random walk extraction, enabling faster and more scalable training.
These findings position GraphOracle as a practical and principled solution for
faithful class-level self-explainability in GNNs.
Ссылки и действия
Дополнительные ресурсы: