Over-Squashing in GNNs and Causal Inference of Rewiring Strategies

2508.09265v1 cs.LG, stat.ME 2025-08-15

Авторы:

Danial Saber, Amirali Salehi-Abari

Резюме на русском

## Контекст Graph neural networks (GNNs) широко применяются в таких областях, как рекомендательные системы, проектирование материалов и репозиция лекарств. Однако message-passing GNNs сталкиваются с проблемой over-squashing — экспоненциального сжатия длинного-дистанционного информации между узлами. Эта проблема ограничивает их выразительность и эффективность. Несмотря на то, что ревьюинг (ревьютинг) техник могут уменьшить эту проблему, их эффективность и практическое влияние недостаточно изучены, в частности, из-за отсутствия точной метрики для измерения over-squashing. Мы предлагаем метод оценки over-squashing на основе декремента чувствительности между узлами, который может быть расширен на граф-уровневые статистики: распространенность, интенсивность, вариабельность и экстремальность. Целью нашей работы является оценка того, как различные методы ревьюинга влияют на over-squashing и как эти изменения отражаются на результатах классификации. ## Метод Мы предлагаем метрику, основанную на мультипликативном снижении чувствительности (Mutual Sensitivity Decay, MSI), чтобы измерить over-squashing между узлами. Эта метрика позволяет проанализировать как индивидуальные пары узлов, так и графы в целом. Для оценки over-squashing на уровне графа, мы разработали граф-уровневые метрики: prevalence, intensity, variability и extremity. Для изучения эффекта ревьюинга, мы применяем между-графовую проекцию (within-graph causal design) для измерения потенциального влияния ревьюинг-методов на классификационные данные. Мы проводим эксперименты на нескольких бенчмарках классификации графа и нод, чтобы оценить то, как различные методы ревьюинга влияют на over-squashing и на предсказательную эффективность моделей. ## Результаты Наши эксперименты показали, что большинство датасетов классификации графа страдают от over-squashing, но в разных масштабах. Мы обнаружили, что ревьюинг может существенно уменьшить over-squashing, особенно когда данные сильно страдают от этой проблемы. Однако, на node classification datasets, ревьюинг часто усиливает over-squashing, и преобразования в over-squashing не коррелируют с изменениями в производительности. Мы также обнаружили, что только тщательно примененная ревьюинг может улучшить результаты, тогда как неограниченный или чрезмерно агрессивный ревьюинг может привести к негативным результатам. Наши метрики позволяют практикам установить, плановая ли ревьюинга, и будет ли она эффективна на определенном датасете. ## Значимость Наши результаты имеют большое значение для области GNNs, поскольку они демонстрируют, что over-squashing является важной проблемой для классификации графа, но её значимость и оптимальный подход к решению зависят от конкретных датасетов и за

Abstract

Graph neural networks (GNNs) have exhibited state-of-the-art performance across wide-range of domains such as recommender systems, material design, and drug repurposing. Yet message-passing GNNs suffer from over-squashing -- exponential compression of long-range information from distant nodes -- which limits expressivity. Rewiring techniques can ease this bottleneck; but their practical impacts are unclear due to the lack of a direct empirical over-squashing metric. We propose a rigorous, topology-focused method for assessing over-squashing between node pairs using the decay rate of their mutual sensitivity. We then extend these pairwise assessments to four graph-level statistics (prevalence, intensity, variability, extremity). Coupling these metrics with a within-graph causal design, we quantify how rewiring strategies affect over-squashing on diverse graph- and node-classification benchmarks. Our extensive empirical analyses show that most graph classification datasets suffer from over-squashing (but to various extents), and rewiring effectively mitigates it -- though the degree of mitigation, and its translation into performance gains, varies by dataset and method. We also found that over-squashing is less notable in node classification datasets, where rewiring often increases over-squashing, and performance variations are uncorrelated with over-squashing changes. These findings suggest that rewiring is most beneficial when over-squashing is both substantial and corrected with restraint -- while overly aggressive rewiring, or rewiring applied to minimally over-squashed graphs, is unlikely to help and may even harm performance. Our plug-and-play diagnostic tool lets practitioners decide -- before any training -- whether rewiring is likely to pay off.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Over-Squashing in GNNs and Causal Inference of Rewiring Strategies

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Bayesian Event-Based Model for Disease Subtype and Stage Inference

Adaptive Decentralized Federated Learning for Robust Optimization

Adaptive Decentralized Federated Learning for Robust Optimization

Causal Synthetic Data Generation in Recruitment

Nonparametric estimation of conditional probability distributions using a genera...

Навигация