Why does your graph neural network fail on some graphs? Insights from exact generalisation error

2509.10337v1 stat.ML, cs.LG 2025-09-16
Авторы:

Nil Ayday, Mahalakshmi Sabanayagam, Debarghya Ghoshdastidar

Резюме на русском

#### Контекст Graph Neural Networks (GNNs) широко применяются в области обучения на данных с графовой структурой. Тем не менее, причины, по которым GNNs могут успешно обобщаться на неизвестных данных, или, наоборот, могут провалиться, пока не ясны. Существуют работы, исследовавшие ограничения архитектурных характеристик, такие как over-smoothing и over-squashing, но они не дают полного понимания, что позволяет GNNs эффективно извлекать смысловую информацию. Эти вопросы связаны с понятием generalisation: способностью модели делать точные прогнозы на необученных данных. Несмотря на то, что некоторые работы предложили оценки generalisation error для GNNs, они часто оказываются слишком грубыми, привязаны к одной конкретной архитектуре и не дают полного видения того, что влияет на generalisation в реальных условиях. Мы предлагаем другой подход, основываясь на точном вычислении generalisation error в transductive fixed-design среде с использованием принципов signal processing. #### Метод Мы рассматриваем GNNs как graph filter operators, которые применяются к фичевым данным нод с помощью структуры графа. Мы фокусируемся на линейных GNNs, при этом допускаем нелинейность в графических фильтрах. Это позволяет нам определить точную формулу generalisation error для широкого класса GNNs, включая convolutional, PageRank-based и attention-based модели. Мы показываем, что только информация, которая тесно связана с графовой структурой и фичами, вкладывается в generalisation. Мы также изучаем влияние homophily (схожести нод) на generalisation. Наш подход даёт фреймворм для понимания, почему GNNs могут эффективно использовать структурную и фичевую информацию, и подсказывает, когда и почему они могут провалиться. #### Результаты Мы проводили эксперименты на различных графах, включая задачи link prediction и node classification. Использовавшимися данными были фичавыражения нод, а также структура графа. Мы сравнивали результаты наших вычислений generalisation error с реальными результатами моделей GNNs. Результаты показали, что наша теоретическая модель точно предсказывает, какие модели и на каких графах будут работать лучше. Мы также проанализировали влияние параметров, таких как homophily, на generalisation. Наши результаты подтверждают, что только аллигационная информация (информация, которая тесно связана с графовой структурой) влияет на generalisation, что отклоняет влияние других факторов. #### Значимость Наше исследование имеет значимые последствия для области обучения на графах. Мы предоставляем новую точку зрения на то, как GNNs обучаются и почему они могут провалиться. Наши результаты имеют практическое значение для model selection и optimisation GNN-based architectures. Мы также показали, что homophily важно для generalisation, что может помочь в адаптации моделей к различным типам графов

Abstract

Graph Neural Networks (GNNs) are widely used in learning on graph-structured data, yet a principled understanding of why they succeed or fail remains elusive. While prior works have examined architectural limitations such as over-smoothing and over-squashing, these do not explain what enables GNNs to extract meaningful representations or why performance varies drastically between similar architectures. These questions are related to the role of generalisation: the ability of a model to make accurate predictions on unlabelled data. Although several works have derived generalisation error bounds for GNNs, these are typically loose, restricted to a single architecture, and offer limited insight into what governs generalisation in practice. In this work, we take a different approach by deriving the exact generalisation error for GNNs in a transductive fixed-design setting through the lens of signal processing. From this viewpoint, GNNs can be interpreted as graph filter operators that act on node features via the graph structure. By focusing on linear GNNs while allowing non-linearity in the graph filters, we derive the first exact generalisation error for a broad range of GNNs, including convolutional, PageRank-based, and attention-based models. The exact characterisation of the generalisation error reveals that only the aligned information between node features and graph structure contributes to generalisation. Furthermore, we quantify the effect of homophily on generalisation. Our work provides a framework that explains when and why GNNs can effectively leverage structural and feature information, offering practical guidance for model selection.

Ссылки и действия