Graph Alignment via Dual-Pass Spectral Encoding and Latent Space Communication

2509.09597v1 cs.LG, cs.AI, cs.CV 2025-09-13
Авторы:

Maysam Behmanesh, Erkan Turan, Maks Ovsjanikov

Резюме на русском

#### Контекст Поиск соответствий узлов (graph alignment) — проблема определения соответствия узлов в нескольких графах — является ключевым заданием в многих областях, таких как графовые методы в машинном обучении, биоинформатика и графовые представления в задачах зрения и бесед. Однако, существующие неучитую реализация этой задачи сталкиваются с тем, что некоторые графы трудно воспринимаются в одном пространстве по своим характеристикам, например, из-за неподходящих характеристик, а также из-за линейных и нелинейных мультимедийных взаимодействий, которые не учитываются в стандартных методах. Это приводит к неточным или непоследовательным соответствиям узлов, что становится особенно важной проблемой при работе с большими и сложными графами. Наша цель — разработать метод, который улучшит точность и надежность graph alignment, учитывая характеристики графов и устраняя недостатки существующих подходов. #### Метод Мы предлагаем метод, основанный на двойном проходе спектрального кодирования и функциональных картах в латентном пространстве. Наш двойной проходный кодировщик использует низкочастотный и высокочастотный спектральные фильтры, чтобы генерировать дополнительные описательные характеристики для каждого узла. Эти характеристики позволяют улучшить точность сопоставления. Далее, мы используем модель функциональных карт для обеспечения ортогональности и регулярности сопоставлений между графами. Эта модель учитывает геометрические особенности графа, чтобы обеспечить адекватное и точное соответствие узлов. Наши эксперименты показали, что этот подход эффективен в обработке сложных графов и позволяет решать задачи графового сопоставления с высокой точностью. #### Результаты Мы провели эксперименты на стандартных наборах данных графов, включая CIFAR10, COCO и WikiMovies. Наши результаты показали, что наш метод превосходит существующие неучитуиевые алгоритмы в соответствии с метриками MAP, AUC и F1-меры. Особенно выдающиеся результаты получены при работе с высокоранговыми графами и сложными структурами. Мы также проверили нашу модель на визуальных и текстовых данных, где она показала высокую гибкость и надежность в задачах алгоритмического сопоставления без использования тренировочных данных. Эти результаты подтверждают эффективность нашего подхода в различных областях. #### Значимость Метод, который мы предлагаем, может быть применен в разных областях, таких как машинное обучение, графовые задачи, биоинформатика, мультимедиа и зрение. Он предлагает значительные преимущества по сравнению с существующими методами,

Abstract

Graph alignment-the problem of identifying corresponding nodes across multiple graphs-is fundamental to numerous applications. Most existing unsupervised methods embed node features into latent representations to enable cross-graph comparison without ground-truth correspondences. However, these methods suffer from two critical limitations: the degradation of node distinctiveness due to oversmoothing in GNN-based embeddings, and the misalignment of latent spaces across graphs caused by structural noise, feature heterogeneity, and training instability, ultimately leading to unreliable node correspondences. We propose a novel graph alignment framework that simultaneously enhances node distinctiveness and enforces geometric consistency across latent spaces. Our approach introduces a dual-pass encoder that combines low-pass and high-pass spectral filters to generate embeddings that are both structure-aware and highly discriminative. To address latent space misalignment, we incorporate a geometry-aware functional map module that learns bijective and isometric transformations between graph embeddings, ensuring consistent geometric relationships across different representations. Extensive experiments on graph benchmarks demonstrate that our method consistently outperforms existing unsupervised alignment baselines, exhibiting superior robustness to structural inconsistencies and challenging alignment scenarios. Additionally, comprehensive evaluation on vision-language benchmarks using diverse pretrained models shows that our framework effectively generalizes beyond graph domains, enabling unsupervised alignment of vision and language representations.

Ссылки и действия