Evaluating Cumulative Spectral Gradient as a Complexity Measure
2509.02399v1
cs.LG, cs.CL
2025-09-05
Авторы:
Haji Gul, Abdul Ghani Naim, Ajaz Ahmad Bhat
Резюме на русском
## Контекст
Оценка сложности данных является ключевым аспектом в экспериментах по сравнению различных алгоритмов решения задач, включая задачи классификации и многоклассовой классификации. Для оценки и сравнения моделей классификации в задачах, связанных с знаниями (knowledge graphs, KGs), необходимо измерить сложность данных, так как сложность может существенно влиять на результаты моделей. Однако существуют проблемы с выбором подходящих метрик сложности, которые могут не справляться с задачей из-за необходимости ручной оптимизации или неточности мер. Эта проблема становится еще более актуальной в задачах многоклассовой классификации, таких как прогнозирование связей в KGs.
## Метод
В данном исследовании рассматривается метрика сложности данных, известная как Кумулятивная Градиентная Мерна (Cumulative Spectral Gradient, CSG). Данная метрика определяется как проблематическая мерная функция, которая зависит от расстояния в эмбеддинг-пространстве и использует спектральный кластеринг для определения сложности. CSG измеряется в зависимости от двух параметров: количество Monte Carlo сэмплов (M) и количество ближайших соседей в пространстве эмбеддингов (K). Эти параметры оптимизируются для получения наилучшего подхода к оценке сложности.
## Результаты
Проведены эксперименты на нескольких стандартных датасетах, включая FB15k-237 и WN18RR, для подтверждения свойств CSG. Было проанализировано ее зависимость от параметров M и K, а также сравнены результаты с метриками, такими как Mean Reciprocal Rank (MRR) и другими. Эксперименты показали, что CSG не является стабильной и не является независимой от конкретных значений K. Также было выявлено, что в некоторых случаях CSG не сильно коррелирует с установленными метриками, такими как MRR, что означает, что CSG может некорректно оценивать сложность данных в задачах прогнозирования связей.
## Значимость
Оценка CSG может применяться в качестве меры сложности для прогнозирования связей в KGs, но в рамках этого исследования были выявлены факторы, которые могут снизить достоверность данной меры. Эти результаты могут помочь разработчикам моделей и оценщикам данных для поиска более надежных и независимых методов оценки сложности данных для прогнозирования связей.
## Выводы
Мы показали, что CSG не является надежной мерой сложности для задач прогнозирования связей в KGs. Несмотря на оригинальные утверждения, CSG оказалась сильно зависимой от выбора параметров K и не сильно коррелирует с установленными метриками. Наше исследование подчеркивает необходимость разработки более устойчивых и классификаторно независимых методов оценки сложности данных в задачах прогнозирования связ
Abstract
Accurate estimation of dataset complexity is crucial for evaluating and
comparing link prediction models for knowledge graphs (KGs). The Cumulative
Spectral Gradient (CSG) metric derived from probabilistic divergence between
classes within a spectral clustering framework was proposed as a dataset
complexity measure that (1) naturally scales with the number of classes and (2)
correlates strongly with downstream classification performance. In this work,
we rigorously assess CSG behavior on standard knowledge graph link prediction
benchmarks a multi class tail prediction task, using two key parameters
governing its computation, M, the number of Monte Carlo sampled points per
class, and K, the number of nearest neighbors in the embedding space. Contrary
to the original claims, we find that (1) CSG is highly sensitive to the choice
of K and therefore does not inherently scale with the number of target classes,
and (2) CSG values exhibit weak or no correlation with established performance
metrics such as mean reciprocal rank (MRR). Through experiments on FB15k 237,
WN18RR, and other standard datasets, we demonstrate that CSG purported
stability and generalization predictive power break down in link prediction
settings. Our results highlight the need for more robust, classifier agnostic
complexity measures in KG link prediction evaluation.
Ссылки и действия
Дополнительные ресурсы: