Over-Squashing in GNNs and Causal Inference of Rewiring Strategies
2508.09265v1
cs.LG, stat.ME
2025-08-15
Авторы:
Danial Saber, Amirali Salehi-Abari
Резюме на русском
## Контекст
Graph neural networks (GNNs) широко применяются в таких областях, как рекомендательные системы, проектирование материалов и репозиция лекарств. Однако message-passing GNNs сталкиваются с проблемой over-squashing — экспоненциального сжатия длинного-дистанционного информации между узлами. Эта проблема ограничивает их выразительность и эффективность. Несмотря на то, что ревьюинг (ревьютинг) техник могут уменьшить эту проблему, их эффективность и практическое влияние недостаточно изучены, в частности, из-за отсутствия точной метрики для измерения over-squashing. Мы предлагаем метод оценки over-squashing на основе декремента чувствительности между узлами, который может быть расширен на граф-уровневые статистики: распространенность, интенсивность, вариабельность и экстремальность. Целью нашей работы является оценка того, как различные методы ревьюинга влияют на over-squashing и как эти изменения отражаются на результатах классификации.
## Метод
Мы предлагаем метрику, основанную на мультипликативном снижении чувствительности (Mutual Sensitivity Decay, MSI), чтобы измерить over-squashing между узлами. Эта метрика позволяет проанализировать как индивидуальные пары узлов, так и графы в целом. Для оценки over-squashing на уровне графа, мы разработали граф-уровневые метрики: prevalence, intensity, variability и extremity. Для изучения эффекта ревьюинга, мы применяем между-графовую проекцию (within-graph causal design) для измерения потенциального влияния ревьюинг-методов на классификационные данные. Мы проводим эксперименты на нескольких бенчмарках классификации графа и нод, чтобы оценить то, как различные методы ревьюинга влияют на over-squashing и на предсказательную эффективность моделей.
## Результаты
Наши эксперименты показали, что большинство датасетов классификации графа страдают от over-squashing, но в разных масштабах. Мы обнаружили, что ревьюинг может существенно уменьшить over-squashing, особенно когда данные сильно страдают от этой проблемы. Однако, на node classification datasets, ревьюинг часто усиливает over-squashing, и преобразования в over-squashing не коррелируют с изменениями в производительности. Мы также обнаружили, что только тщательно примененная ревьюинг может улучшить результаты, тогда как неограниченный или чрезмерно агрессивный ревьюинг может привести к негативным результатам. Наши метрики позволяют практикам установить, плановая ли ревьюинга, и будет ли она эффективна на определенном датасете.
## Значимость
Наши результаты имеют большое значение для области GNNs, поскольку они демонстрируют, что over-squashing является важной проблемой для классификации графа, но её значимость и оптимальный подход к решению зависят от конкретных датасетов и за
Abstract
Graph neural networks (GNNs) have exhibited state-of-the-art performance
across wide-range of domains such as recommender systems, material design, and
drug repurposing. Yet message-passing GNNs suffer from over-squashing --
exponential compression of long-range information from distant nodes -- which
limits expressivity. Rewiring techniques can ease this bottleneck; but their
practical impacts are unclear due to the lack of a direct empirical
over-squashing metric. We propose a rigorous, topology-focused method for
assessing over-squashing between node pairs using the decay rate of their
mutual sensitivity. We then extend these pairwise assessments to four
graph-level statistics (prevalence, intensity, variability, extremity).
Coupling these metrics with a within-graph causal design, we quantify how
rewiring strategies affect over-squashing on diverse graph- and
node-classification benchmarks. Our extensive empirical analyses show that most
graph classification datasets suffer from over-squashing (but to various
extents), and rewiring effectively mitigates it -- though the degree of
mitigation, and its translation into performance gains, varies by dataset and
method. We also found that over-squashing is less notable in node
classification datasets, where rewiring often increases over-squashing, and
performance variations are uncorrelated with over-squashing changes. These
findings suggest that rewiring is most beneficial when over-squashing is both
substantial and corrected with restraint -- while overly aggressive rewiring,
or rewiring applied to minimally over-squashed graphs, is unlikely to help and
may even harm performance. Our plug-and-play diagnostic tool lets practitioners
decide -- before any training -- whether rewiring is likely to pay off.
Ссылки и действия
Дополнительные ресурсы: