Graph Alignment via Dual-Pass Spectral Encoding and Latent Space Communication
2509.09597v1
cs.LG, cs.AI, cs.CV
2025-09-13
Авторы:
Maysam Behmanesh, Erkan Turan, Maks Ovsjanikov
Резюме на русском
#### Контекст
Поиск соответствий узлов (graph alignment) — проблема определения соответствия узлов в нескольких графах — является ключевым заданием в многих областях, таких как графовые методы в машинном обучении, биоинформатика и графовые представления в задачах зрения и бесед. Однако, существующие неучитую реализация этой задачи сталкиваются с тем, что некоторые графы трудно воспринимаются в одном пространстве по своим характеристикам, например, из-за неподходящих характеристик, а также из-за линейных и нелинейных мультимедийных взаимодействий, которые не учитываются в стандартных методах. Это приводит к неточным или непоследовательным соответствиям узлов, что становится особенно важной проблемой при работе с большими и сложными графами. Наша цель — разработать метод, который улучшит точность и надежность graph alignment, учитывая характеристики графов и устраняя недостатки существующих подходов.
#### Метод
Мы предлагаем метод, основанный на двойном проходе спектрального кодирования и функциональных картах в латентном пространстве. Наш двойной проходный кодировщик использует низкочастотный и высокочастотный спектральные фильтры, чтобы генерировать дополнительные описательные характеристики для каждого узла. Эти характеристики позволяют улучшить точность сопоставления. Далее, мы используем модель функциональных карт для обеспечения ортогональности и регулярности сопоставлений между графами. Эта модель учитывает геометрические особенности графа, чтобы обеспечить адекватное и точное соответствие узлов. Наши эксперименты показали, что этот подход эффективен в обработке сложных графов и позволяет решать задачи графового сопоставления с высокой точностью.
#### Результаты
Мы провели эксперименты на стандартных наборах данных графов, включая CIFAR10, COCO и WikiMovies. Наши результаты показали, что наш метод превосходит существующие неучитуиевые алгоритмы в соответствии с метриками MAP, AUC и F1-меры. Особенно выдающиеся результаты получены при работе с высокоранговыми графами и сложными структурами. Мы также проверили нашу модель на визуальных и текстовых данных, где она показала высокую гибкость и надежность в задачах алгоритмического сопоставления без использования тренировочных данных. Эти результаты подтверждают эффективность нашего подхода в различных областях.
#### Значимость
Метод, который мы предлагаем, может быть применен в разных областях, таких как машинное обучение, графовые задачи, биоинформатика, мультимедиа и зрение. Он предлагает значительные преимущества по сравнению с существующими методами,
Abstract
Graph alignment-the problem of identifying corresponding nodes across
multiple graphs-is fundamental to numerous applications. Most existing
unsupervised methods embed node features into latent representations to enable
cross-graph comparison without ground-truth correspondences. However, these
methods suffer from two critical limitations: the degradation of node
distinctiveness due to oversmoothing in GNN-based embeddings, and the
misalignment of latent spaces across graphs caused by structural noise, feature
heterogeneity, and training instability, ultimately leading to unreliable node
correspondences. We propose a novel graph alignment framework that
simultaneously enhances node distinctiveness and enforces geometric consistency
across latent spaces. Our approach introduces a dual-pass encoder that combines
low-pass and high-pass spectral filters to generate embeddings that are both
structure-aware and highly discriminative. To address latent space
misalignment, we incorporate a geometry-aware functional map module that learns
bijective and isometric transformations between graph embeddings, ensuring
consistent geometric relationships across different representations. Extensive
experiments on graph benchmarks demonstrate that our method consistently
outperforms existing unsupervised alignment baselines, exhibiting superior
robustness to structural inconsistencies and challenging alignment scenarios.
Additionally, comprehensive evaluation on vision-language benchmarks using
diverse pretrained models shows that our framework effectively generalizes
beyond graph domains, enabling unsupervised alignment of vision and language
representations.
Ссылки и действия
Дополнительные ресурсы: