Evaluating Knowledge Graph Complexity via Semantic, Spectral, and Structural Metrics for Link Prediction
2508.15291v1
cs.LG, cs.CL
2025-08-23
Авторы:
Haji Gul, Abul Ghani Naim, Ajaz Ahmad Bhat
Резюме на русском
## Контекст
Исследование сложности знаний графов (Knowledge Graphs, KGs) является ключевым элементом в оценке и сравнении моделей связывания связей (link prediction). Одним из значимых показателей сложности является Cumulative Spectral Gradient (CSG), основанный на разности классов в рамках спектрального кластеринга. Хотя CSG утверждается как классификатор-независимый и стабильный метрика, его применимость к KGs не была ранее проверена. Наша мотивация заключается в том, чтобы провести критический анализ CSG в контексте многомерного связывания связей и проверить его связь с классическими метриками производительности, такими как Mean Reciprocal Rank (MRR) и Hit@1.
## Метод
Для оценки сложности знаний графов мы применяем метод кластеринга на основе спектра, заключающийся в использовании CSG. Эта метрика определяется по проблеме вертикального разделения классов в спектральном пространстве. Мы также используем семантические представления, полученные с помощью трансформеров, для добавления контекстной информации. Для более широкого анализа мы вводим дополнительные метрики, включая Relation Entropy, Maximum Relation Diversity и Relation Type Cardinality, которые охватывают глобальные и локальные аспекты сложности. Для сравнения мы используем метрики, такие как Average Degree, Degree Entropy, PageRank и Eigenvector Centrality, измеряющие графовую связность.
## Результаты
Наши эксперименты показали, что CSG весьма чувствителен к параметрам и не способен гарантировать стабильность или робастность при изменении количества классов. Данные показатели не сильно коррелируют с MRR и Hit@1, что означает, что CSG не удается хорошо отразить сложность задачи. Однако метрики типа Relation Entropy и Maximum Relation Diversity сильно коррелируют с MRR и Hit@1, показывая свою надежность в оценке сложности знаний графов. Метрики типа PageRank и Eigenvector Centrality, определяющие связность графа, сильно коррелируют с Hit@10, что указывает на их важность для задач, где требуется учитывать глобальную структуру.
## Значимость
Наши результаты имеют практическое значение для развития моделей связывания связей. Мы показали, что CSG, несмотря на его теоретическую привлекательность, не является надежной метрикой для оценки сложности KGs. Вместо этого мы предлагаем использовать метрики, такие как Relation Entropy и Maximum Relation Diversity, которые более точно отражают сложность задачи. Эти метрики могут помочь в оптимизации моделей и сравнении их производительности. Эти результаты также имеют значение для изучения сложности данных в других задачах, где спектральные методы используются для классификации.
## Выводы
Мы установили, что CSG не является достаточно устойчивой и интерпретируемой метрикой для оценки сложности знаний графов в
Abstract
Understanding dataset complexity is fundamental to evaluating and comparing
link prediction models on knowledge graphs (KGs). While the Cumulative Spectral
Gradient (CSG) metric, derived from probabilistic divergence between classes
within a spectral clustering framework, has been proposed as a classifier
agnostic complexity metric purportedly scaling with class cardinality and
correlating with downstream performance, it has not been evaluated in KG
settings so far. In this work, we critically examine CSG in the context of
multi relational link prediction, incorporating semantic representations via
transformer derived embeddings. Contrary to prior claims, we find that CSG is
highly sensitive to parametrisation and does not robustly scale with the number
of classes. Moreover, it exhibits weak or inconsistent correlation with
standard performance metrics such as Mean Reciprocal Rank (MRR) and Hit@1. To
deepen the analysis, we introduce and benchmark a set of structural and
semantic KG complexity metrics. Our findings reveal that global and local
relational ambiguity captured via Relation Entropy, node level Maximum Relation
Diversity, and Relation Type Cardinality exhibit strong inverse correlations
with MRR and Hit@1, suggesting these as more faithful indicators of task
difficulty. Conversely, graph connectivity measures such as Average Degree,
Degree Entropy, PageRank, and Eigenvector Centrality correlate positively with
Hit@10. Our results demonstrate that CSGs purported stability and
generalization predictive power fail to hold in link prediction settings and
underscore the need for more stable, interpretable, and task-aligned measures
of dataset complexity in knowledge driven learning.
Ссылки и действия
Дополнительные ресурсы: