Enhancing Fairness in Autoencoders for Node-Level Graph Anomaly Detection
2508.10785v1
cs.LG, cs.AI, stat.ML
2025-08-16
Авторы:
Shouju Wang, Yuchen Song, Sheng'en Li, Dongmian Zou
Резюме на русском
## Контекст
Графовая ананомальная детекция (Graph Anomaly Detection, GAD) широко применяется в различных областях, включая мониторинг сетей, безопасность интернета и мошенничество. Несмотря на то, что графовые нейронные сети (GNN) оказались эффективными для решения задач GAD, они могут сохранять и даже усиливать биазы, присущие обучающим данным. Эти биазы могут приводить к уравновешиванию результатов и несправедливости, особенно для групп, которые немного представленны в данных. До сих пор большинство работ по фейренесу фокусировались на задачах классификации, в то время как задача GAD обычно основывается на автокодировщиках, что делает существующие подходы нецелесообразными. Мы стремимся создать фреймворк, который повысит уровень справедливости в автокодировщиках GAD без ущерба для графовой ананомальной детекции.
## Метод
Мы предлагаем **DECAF-GAD**, фреймворк, основанный на структурной кауальной модели (Structural Causal Model, SCM). Эта модель используется для дисентроповки чувствительных атрибутов из представлений, полученных с помощью автокодировщика. Мы также разработали специальную архитектуру автокодировщика, которая интегрирует fairness-guided loss function для выравнивания результатов. Модель DECAF-GAD способна уменьшить уравновешивание биаз в графе, не ухудшая производительность задачи GAD. Для оценки модели мы использовали как синтетические, так и реальные данные, включая такие высококачественные графы, как Cora и Citeseer.
## Результаты
Мы провели многочисленные эксперименты для сравнения DECAF-GAD с существующими методами GAD. Результаты показали, что DECAF-GAD достигает конкурентной производительности в задаче GAD, например в достоверности и рекультурации аномалий, при этом показывая значительное улучшение метрик справедливости. На синтетических данных, наполненных специальными биазами, DECAF-GAD значительно снизил уравновешивание по отношению к нечувствительным атрибутам. Тем самым, он доказал улучшение справедливости без ущерба для точности детекции.
## Значимость
DECAF-GAD может быть применен в широком спектре задач, таких как безопасность сетей, мониторинг транзакций и мошенничество. Его основное преимущество заключается в том, что он может эффективно уменьшать уравновешивание биаз в дорогостоящих и сложных графных данных, не ухудшая производительность. Это делает его привлекательным для приложений, где справедливость критична, таких как мониторинг медицинских данных и финансовых операций. Наш подход может иметь значительное влияние, способствуя развитию справедливых и эффективных методов GAD в графовых сетях.
## Вы
Abstract
Graph anomaly detection (GAD) has become an increasingly important task
across various domains. With the rapid development of graph neural networks
(GNNs), GAD methods have achieved significant performance improvements.
However, fairness considerations in GAD remain largely underexplored. Indeed,
GNN-based GAD models can inherit and amplify biases present in training data,
potentially leading to unfair outcomes. While existing efforts have focused on
developing fair GNNs, most approaches target node classification tasks, where
models often rely on simple layer architectures rather than autoencoder-based
structures, which are the most widely used architecturs for anomaly detection.
To address fairness in autoencoder-based GAD models, we propose
\textbf{D}is\textbf{E}ntangled \textbf{C}ounterfactual \textbf{A}dversarial
\textbf{F}air (DECAF)-GAD, a framework that alleviates bias while preserving
GAD performance. Specifically, we introduce a structural causal model (SCM) to
disentangle sensitive attributes from learned representations. Based on this
causal framework, we formulate a specialized autoencoder architecture along
with a fairness-guided loss function. Through extensive experiments on both
synthetic and real-world datasets, we demonstrate that DECAF-GAD not only
achieves competitive anomaly detection performance but also significantly
enhances fairness metrics compared to baseline GAD methods. Our code is
available at https://github.com/Tlhey/decaf_code.
Ссылки и действия
Дополнительные ресурсы: