Evaluating Knowledge Graph Complexity via Semantic, Spectral, and Structural Metrics for Link Prediction

2508.15291v1 cs.LG, cs.CL 2025-08-23
Авторы:

Haji Gul, Abul Ghani Naim, Ajaz Ahmad Bhat

Резюме на русском

## Контекст Исследование сложности знаний графов (Knowledge Graphs, KGs) является ключевым элементом в оценке и сравнении моделей связывания связей (link prediction). Одним из значимых показателей сложности является Cumulative Spectral Gradient (CSG), основанный на разности классов в рамках спектрального кластеринга. Хотя CSG утверждается как классификатор-независимый и стабильный метрика, его применимость к KGs не была ранее проверена. Наша мотивация заключается в том, чтобы провести критический анализ CSG в контексте многомерного связывания связей и проверить его связь с классическими метриками производительности, такими как Mean Reciprocal Rank (MRR) и Hit@1. ## Метод Для оценки сложности знаний графов мы применяем метод кластеринга на основе спектра, заключающийся в использовании CSG. Эта метрика определяется по проблеме вертикального разделения классов в спектральном пространстве. Мы также используем семантические представления, полученные с помощью трансформеров, для добавления контекстной информации. Для более широкого анализа мы вводим дополнительные метрики, включая Relation Entropy, Maximum Relation Diversity и Relation Type Cardinality, которые охватывают глобальные и локальные аспекты сложности. Для сравнения мы используем метрики, такие как Average Degree, Degree Entropy, PageRank и Eigenvector Centrality, измеряющие графовую связность. ## Результаты Наши эксперименты показали, что CSG весьма чувствителен к параметрам и не способен гарантировать стабильность или робастность при изменении количества классов. Данные показатели не сильно коррелируют с MRR и Hit@1, что означает, что CSG не удается хорошо отразить сложность задачи. Однако метрики типа Relation Entropy и Maximum Relation Diversity сильно коррелируют с MRR и Hit@1, показывая свою надежность в оценке сложности знаний графов. Метрики типа PageRank и Eigenvector Centrality, определяющие связность графа, сильно коррелируют с Hit@10, что указывает на их важность для задач, где требуется учитывать глобальную структуру. ## Значимость Наши результаты имеют практическое значение для развития моделей связывания связей. Мы показали, что CSG, несмотря на его теоретическую привлекательность, не является надежной метрикой для оценки сложности KGs. Вместо этого мы предлагаем использовать метрики, такие как Relation Entropy и Maximum Relation Diversity, которые более точно отражают сложность задачи. Эти метрики могут помочь в оптимизации моделей и сравнении их производительности. Эти результаты также имеют значение для изучения сложности данных в других задачах, где спектральные методы используются для классификации. ## Выводы Мы установили, что CSG не является достаточно устойчивой и интерпретируемой метрикой для оценки сложности знаний графов в

Abstract

Understanding dataset complexity is fundamental to evaluating and comparing link prediction models on knowledge graphs (KGs). While the Cumulative Spectral Gradient (CSG) metric, derived from probabilistic divergence between classes within a spectral clustering framework, has been proposed as a classifier agnostic complexity metric purportedly scaling with class cardinality and correlating with downstream performance, it has not been evaluated in KG settings so far. In this work, we critically examine CSG in the context of multi relational link prediction, incorporating semantic representations via transformer derived embeddings. Contrary to prior claims, we find that CSG is highly sensitive to parametrisation and does not robustly scale with the number of classes. Moreover, it exhibits weak or inconsistent correlation with standard performance metrics such as Mean Reciprocal Rank (MRR) and Hit@1. To deepen the analysis, we introduce and benchmark a set of structural and semantic KG complexity metrics. Our findings reveal that global and local relational ambiguity captured via Relation Entropy, node level Maximum Relation Diversity, and Relation Type Cardinality exhibit strong inverse correlations with MRR and Hit@1, suggesting these as more faithful indicators of task difficulty. Conversely, graph connectivity measures such as Average Degree, Degree Entropy, PageRank, and Eigenvector Centrality correlate positively with Hit@10. Our results demonstrate that CSGs purported stability and generalization predictive power fail to hold in link prediction settings and underscore the need for more stable, interpretable, and task-aligned measures of dataset complexity in knowledge driven learning.

Ссылки и действия