CRoC: Context Refactoring Contrast for Graph Anomaly Detection with Limited Supervision

2508.12278v1 cs.LG, cs.AI 2025-08-19
Авторы:

Siyue Xie, Da Sun Handason Tam, Wing Cheong Lau

Резюме на русском

#### Контекст Графовые нейронные сети (Graph Neural Networks, GNNs) широко используются для решения различных задач на графовых структурах, особенно для анализа таких данных. Однако, обучение надёжных GNNs требует больших массивов меток, что является критическим ограничением в реальных приложениях. Это ограничение становится особенно важным при решении задач графовой детекции аномалий (Graph Anomaly Detection, GAD), где аномалии редки, сложно отмечать и могут активно противостоять обнаружению, скрывая свои характеристики. Данная статья сосредотачивается на выработке метода, который позволит обучать GNNs с минимальным объёмом меток, улучшить их устойчивость и повысить точность в детекции аномалий. #### Метод Методом решения является Context Refactoring Contrast (CRoC), фреймворк, который обучает GNNs с использованием ограниченных меток и богатых немечённых данных. Основная идея заключается в том, чтобы использовать недостаточное количество меток для улучшения процесса обучения и внедрить в GNNs устойчивость к атакам аномалий. CRoC эффективно использует классовую неоднородность в GAD, перекомпоновывая атрибуты узлов в графе и создавая новые графы, которые сохраняют взаимосвязи. Для кодирования сложных взаимодействий между узлами, CRoC использует несколько отношений и внедряет их в процесс передачи сообщений внутри GNNs. В ходе обучения, CRoC интегрирует методы самостоятельного противопоставления (contrastive learning), что позволяет GNNs эффективно использовать необученные данные для повышения качества результатов. #### Результаты Проведенные эксперименты показали, что CRoC эффективно решает задачу детекции аномалий в графах с ограниченным количеством меток. На 7 реальных датасетах, эта модель показала улучшение до 14% в AUC по сравнению с базовыми GNNs. Также, CRoC превосходит текущие лучшие решения в соревнованиях по детекции аномалий в условиях нехватки меток. Эти результаты подтверждают высокую точность и устойчивость модели, даже при минимальном обучении на метках. #### Значимость Решение CRoC может быть применено в различных сферах, где графы являются основной структурой данных, например, в системах мониторинга и безопасности, финансах, здравоохранении и др. Одним из основных преимуществ CRoC является его устойчивость к аномалиям, которые могут активно противостоять обнаружению. Эта модель может повысить точность в многих приложениях, включая обнаружение мошенничества, детекцию вредоносных активностей, а также в задачах анализа данных, где подготовленные данные сложно получить. #### Выводы CRoC демонстрирует мощь и эффективность в обучении GNNs для задач детекции анома

Abstract

Graph Neural Networks (GNNs) are widely used as the engine for various graph-related tasks, with their effectiveness in analyzing graph-structured data. However, training robust GNNs often demands abundant labeled data, which is a critical bottleneck in real-world applications. This limitation severely impedes progress in Graph Anomaly Detection (GAD), where anomalies are inherently rare, costly to label, and may actively camouflage their patterns to evade detection. To address these problems, we propose Context Refactoring Contrast (CRoC), a simple yet effective framework that trains GNNs for GAD by jointly leveraging limited labeled and abundant unlabeled data. Different from previous works, CRoC exploits the class imbalance inherent in GAD to refactor the context of each node, which builds augmented graphs by recomposing the attributes of nodes while preserving their interaction patterns. Furthermore, CRoC encodes heterogeneous relations separately and integrates them into the message-passing process, enhancing the model's capacity to capture complex interaction semantics. These operations preserve node semantics while encouraging robustness to adversarial camouflage, enabling GNNs to uncover intricate anomalous cases. In the training stage, CRoC is further integrated with the contrastive learning paradigm. This allows GNNs to effectively harness unlabeled data during joint training, producing richer, more discriminative node embeddings. CRoC is evaluated on seven real-world GAD datasets with varying scales. Extensive experiments demonstrate that CRoC achieves up to 14% AUC improvement over baseline GNNs and outperforms state-of-the-art GAD methods under limited-label settings.

Ссылки и действия