Community detection robustness of graph neural networks
2509.24662v1
cs.SI, cs.AI, physics.soc-ph, stat.ML
2025-10-01
Авторы:
Jaidev Goel, Pablo Moriano, Ramakrishnan Kannan, Yulia R. Gel
Резюме на русском
## Контекст
Графовые нейронные сети (GNN) широко используются для выявления сообществ (community detection) в атрибутированных графах. Они объединяют структурную топологию и атрибуты узлов с помощью сообщения и пуринга. Однако их устойчивость к различным помехам и атакам в контексте задач community detection остается недостаточно изученной. Этот факт определяет мотивацию поиска подробных механизмов, влияющих на чувствительность GNN к уплотнениям в данных и атакам. Данная работа сосредотачивается на изучении шести ведущих архитектур GNN: GCN, GAT, Graph-SAGE, DiffPool, MinCUT и DMoN. Основная цель — изучить не только основные тенденции, но также сравнить их устойчивость к разным типам помех на синтетических бенчмарках и реальных данных из цитирования.
## Метод
Работа основывается на систематической оценке шести архитектур GNN с применением метрики элементно-центрической сходства для оценки точности выявления сообществ. Эксперименты проводятся на синтетических данных с разными уровнями определения сообществ и на реальных данных в виде цитирующих сетей. Методология включает:
1. **Набор экспериментов**:
- Три категории помех: манипуляции атрибутами узлов, дистропировании единичной топологии и атаках на граф.
- Три типа данных: синтетические графы с управляемым размером сообществ, цитирующие сети.
2. **Архитектуры GNN**:
- GCN: инвариантность к графу.
- GAT: внимательность к узлам.
- Graph-SAGE: агрегация смежных узлов.
- DiffPool: массовая кластеризация.
- MinCUT: редукция графа к минимальным сегментам.
- DMoN: динамический массовый пуринг.
3. **Метрики**:
- Элементно-центрическая сходственность для оценки сообществ.
## Результаты
Результаты экспериментов показывают, что:
1. **Устойчивость к помехам**:
- Управляемые манипуляции с атрибутами узлов и выбросами в триангуляциях графов приводят к существенному снижению точности для GCN, GAT и Graph-SAGE.
- DMoN, напротив, показывает значительную устойчивость в этих сценариях, особенно под сообществами с высоким сигналом.
2. **Атаки**:
- Направленные удаления узлов и изменения распределения атрибутов в GCN и GAT приводят к потере точности.
- Динамические методы, такие как DMoN, сохраняют высокую точность в атаках, особенно при сильных сообществах.
3. **Синтетические бенчмарки**:
- Методы с инвариантностью к графу, такие как GCN, демонстрируют высокую точность при слабых сообществах.
- Добавочные модели, такие как DMoN, превосходят при сильных сообществах и атаках.
## Значимость
Рез
Abstract
Graph neural networks (GNNs) are increasingly widely used for community
detection in attributed networks. They combine structural topology with node
attributes through message passing and pooling. However, their robustness or
lack of thereof with respect to different perturbations and targeted attacks in
conjunction with community detection tasks is not well understood. To shed
light into latent mechanisms behind GNN sensitivity on community detection
tasks, we conduct a systematic computational evaluation of six widely adopted
GNN architectures: GCN, GAT, Graph-SAGE, DiffPool, MinCUT, and DMoN. The
analysis covers three perturbation categories: node attribute manipulations,
edge topology distortions, and adversarial attacks. We use element-centric
similarity as the evaluation metric on synthetic benchmarks and real-world
citation networks. Our findings indicate that supervised GNNs tend to achieve
higher baseline accuracy, while unsupervised methods, particularly DMoN,
maintain stronger resilience under targeted and adversarial perturbations.
Furthermore, robustness appears to be strongly influenced by community
strength, with well-defined communities reducing performance loss. Across all
models, node attribute perturbations associated with targeted edge deletions
and shift in attribute distributions tend to cause the largest degradation in
community recovery. These findings highlight important trade-offs between
accuracy and robustness in GNN-based community detection and offer new insights
into selecting architectures resilient to noise and adversarial attacks.