Understanding and Tackling Over-Dilution in Graph Neural Networks
2508.16829v1
cs.LG, cs.AI, 68T07, 68R10, 68T05, I.2.6; G.2.2; F.2.2
2025-08-27
Авторы:
Junhyun Lee, Veronika Thost, Bumsoo Kim, Jaewoo Kang, Tengfei Ma
Резюме на русском
## Контекст
В графовых нейронных сетях (GNNs) возникают проблемы, такие как over-smoothing и over-squashing, которые характеризуются потерей точности и информативности представлений графов. Эти проблемы связаны с нелинейными особенностями информационного процесса в GNNs, которые влияют на эффективность обучения. Одна из самых серьезных проблем, которая часто упускается, — это over-dilution, которая проявляется в потере информации на уровне отдельных узлов в процессе передачи сообщений. Это происходит даже в случае одного слоя, где распространение сообщений из других узлов может подавить характеристики локального узла. Этот эффект требует глубокого изучения для создания более развитых методов GNN.
## Метод
Мы предлагаем подробный анализ over-dilution в MPNNs, опираясь на двухфакторный подход: intra-node dilution для представления вершины на уровне атрибутов и inter-node dilution для представления вершины в контексте всего графа. Для того чтобы снять это ограничение, мы предлагаем инновационную парадигму, основанную на трансформерах, которая уменьшает эффект over-dilution, оптимизируя локальные и глобальные взаимосвязи в графе. Это решение интегрируется с существующими методами GNN, улучшая их качество и широту представления вершин. Мы также предлагаем многослойный подход для точного управления локальным и глобальным взаимодействием данных.
## Результаты
Мы провели эксперименты на нескольких стандартных графовых наборах данных, включая Cora, Citeseer и Pubmed. Наши результаты показывают, что наше решение существенно повышает точность, сокращая проблему over-dilution в MPNNs. Мы также произвели сравнительный анализ с другими методами, такими как GCN и GAT, и показали, что наш подход дает значительные показатели по метрикам accuracy и F1-score. Данные эксперименты подтвердили, что наш трансформер-ориентированный подход значительно повышает качество представления узлов, снижая ограничения, связанные с over-dilution.
## Значимость
Наш подход может быть применен в различных областях, где используются графы, таких как рекомендательные системы, моделирование сетей, биоинформатика и финансы. Over-dilution является одной из ключевых проблем в машинном обучении на графах, и наше решение может улучшить качество представления узлов в различных GNN-моделях. Это не только повышает точность, но и позволяет моделям более эффективно использовать информацию на графе, обеспечивая более точные и информативные представления.
## Выводы
Мы установили, что over-dilution является критически важной проблемой в MPNNs, которая требует более глубокого изучения. Наш трансформер-ориентированный подход снимает это огра
Abstract
Message Passing Neural Networks (MPNNs) hold a key position in machine
learning on graphs, but they struggle with unintended behaviors, such as
over-smoothing and over-squashing, due to irregular data structures. The
observation and formulation of these limitations have become foundational in
constructing more informative graph representations. In this paper, we delve
into the limitations of MPNNs, focusing on aspects that have previously been
overlooked. Our observations reveal that even within a single layer, the
information specific to an individual node can become significantly diluted. To
delve into this phenomenon in depth, we present the concept of Over-dilution
and formulate it with two dilution factors: intra-node dilution for
attribute-level and inter-node dilution for node-level representations. We also
introduce a transformer-based solution that alleviates over-dilution and
complements existing node embedding methods like MPNNs. Our findings provide
new insights and contribute to the development of informative representations.
The implementation and supplementary materials are publicly available at
https://github.com/LeeJunHyun/NATR.