CRoC: Context Refactoring Contrast for Graph Anomaly Detection with Limited Supervision
2508.12278v1
cs.LG, cs.AI
2025-08-19
Авторы:
Siyue Xie, Da Sun Handason Tam, Wing Cheong Lau
Резюме на русском
#### Контекст
Графовые нейронные сети (Graph Neural Networks, GNNs) широко используются для решения различных задач на графовых структурах, особенно для анализа таких данных. Однако, обучение надёжных GNNs требует больших массивов меток, что является критическим ограничением в реальных приложениях. Это ограничение становится особенно важным при решении задач графовой детекции аномалий (Graph Anomaly Detection, GAD), где аномалии редки, сложно отмечать и могут активно противостоять обнаружению, скрывая свои характеристики. Данная статья сосредотачивается на выработке метода, который позволит обучать GNNs с минимальным объёмом меток, улучшить их устойчивость и повысить точность в детекции аномалий.
#### Метод
Методом решения является Context Refactoring Contrast (CRoC), фреймворк, который обучает GNNs с использованием ограниченных меток и богатых немечённых данных. Основная идея заключается в том, чтобы использовать недостаточное количество меток для улучшения процесса обучения и внедрить в GNNs устойчивость к атакам аномалий. CRoC эффективно использует классовую неоднородность в GAD, перекомпоновывая атрибуты узлов в графе и создавая новые графы, которые сохраняют взаимосвязи. Для кодирования сложных взаимодействий между узлами, CRoC использует несколько отношений и внедряет их в процесс передачи сообщений внутри GNNs. В ходе обучения, CRoC интегрирует методы самостоятельного противопоставления (contrastive learning), что позволяет GNNs эффективно использовать необученные данные для повышения качества результатов.
#### Результаты
Проведенные эксперименты показали, что CRoC эффективно решает задачу детекции аномалий в графах с ограниченным количеством меток. На 7 реальных датасетах, эта модель показала улучшение до 14% в AUC по сравнению с базовыми GNNs. Также, CRoC превосходит текущие лучшие решения в соревнованиях по детекции аномалий в условиях нехватки меток. Эти результаты подтверждают высокую точность и устойчивость модели, даже при минимальном обучении на метках.
#### Значимость
Решение CRoC может быть применено в различных сферах, где графы являются основной структурой данных, например, в системах мониторинга и безопасности, финансах, здравоохранении и др. Одним из основных преимуществ CRoC является его устойчивость к аномалиям, которые могут активно противостоять обнаружению. Эта модель может повысить точность в многих приложениях, включая обнаружение мошенничества, детекцию вредоносных активностей, а также в задачах анализа данных, где подготовленные данные сложно получить.
#### Выводы
CRoC демонстрирует мощь и эффективность в обучении GNNs для задач детекции анома
Abstract
Graph Neural Networks (GNNs) are widely used as the engine for various
graph-related tasks, with their effectiveness in analyzing graph-structured
data. However, training robust GNNs often demands abundant labeled data, which
is a critical bottleneck in real-world applications. This limitation severely
impedes progress in Graph Anomaly Detection (GAD), where anomalies are
inherently rare, costly to label, and may actively camouflage their patterns to
evade detection. To address these problems, we propose Context Refactoring
Contrast (CRoC), a simple yet effective framework that trains GNNs for GAD by
jointly leveraging limited labeled and abundant unlabeled data. Different from
previous works, CRoC exploits the class imbalance inherent in GAD to refactor
the context of each node, which builds augmented graphs by recomposing the
attributes of nodes while preserving their interaction patterns. Furthermore,
CRoC encodes heterogeneous relations separately and integrates them into the
message-passing process, enhancing the model's capacity to capture complex
interaction semantics. These operations preserve node semantics while
encouraging robustness to adversarial camouflage, enabling GNNs to uncover
intricate anomalous cases. In the training stage, CRoC is further integrated
with the contrastive learning paradigm. This allows GNNs to effectively harness
unlabeled data during joint training, producing richer, more discriminative
node embeddings. CRoC is evaluated on seven real-world GAD datasets with
varying scales. Extensive experiments demonstrate that CRoC achieves up to 14%
AUC improvement over baseline GNNs and outperforms state-of-the-art GAD methods
under limited-label settings.
Ссылки и действия
Дополнительные ресурсы: