Evaluating Cumulative Spectral Gradient as a Complexity Measure

2509.02399v1 cs.LG, cs.CL 2025-09-05

Авторы:

Haji Gul, Abdul Ghani Naim, Ajaz Ahmad Bhat

Резюме на русском

## Контекст Оценка сложности данных является ключевым аспектом в экспериментах по сравнению различных алгоритмов решения задач, включая задачи классификации и многоклассовой классификации. Для оценки и сравнения моделей классификации в задачах, связанных с знаниями (knowledge graphs, KGs), необходимо измерить сложность данных, так как сложность может существенно влиять на результаты моделей. Однако существуют проблемы с выбором подходящих метрик сложности, которые могут не справляться с задачей из-за необходимости ручной оптимизации или неточности мер. Эта проблема становится еще более актуальной в задачах многоклассовой классификации, таких как прогнозирование связей в KGs. ## Метод В данном исследовании рассматривается метрика сложности данных, известная как Кумулятивная Градиентная Мерна (Cumulative Spectral Gradient, CSG). Данная метрика определяется как проблематическая мерная функция, которая зависит от расстояния в эмбеддинг-пространстве и использует спектральный кластеринг для определения сложности. CSG измеряется в зависимости от двух параметров: количество Monte Carlo сэмплов (M) и количество ближайших соседей в пространстве эмбеддингов (K). Эти параметры оптимизируются для получения наилучшего подхода к оценке сложности. ## Результаты Проведены эксперименты на нескольких стандартных датасетах, включая FB15k-237 и WN18RR, для подтверждения свойств CSG. Было проанализировано ее зависимость от параметров M и K, а также сравнены результаты с метриками, такими как Mean Reciprocal Rank (MRR) и другими. Эксперименты показали, что CSG не является стабильной и не является независимой от конкретных значений K. Также было выявлено, что в некоторых случаях CSG не сильно коррелирует с установленными метриками, такими как MRR, что означает, что CSG может некорректно оценивать сложность данных в задачах прогнозирования связей. ## Значимость Оценка CSG может применяться в качестве меры сложности для прогнозирования связей в KGs, но в рамках этого исследования были выявлены факторы, которые могут снизить достоверность данной меры. Эти результаты могут помочь разработчикам моделей и оценщикам данных для поиска более надежных и независимых методов оценки сложности данных для прогнозирования связей. ## Выводы Мы показали, что CSG не является надежной мерой сложности для задач прогнозирования связей в KGs. Несмотря на оригинальные утверждения, CSG оказалась сильно зависимой от выбора параметров K и не сильно коррелирует с установленными метриками. Наше исследование подчеркивает необходимость разработки более устойчивых и классификаторно независимых методов оценки сложности данных в задачах прогнозирования связ

Abstract

Accurate estimation of dataset complexity is crucial for evaluating and comparing link prediction models for knowledge graphs (KGs). The Cumulative Spectral Gradient (CSG) metric derived from probabilistic divergence between classes within a spectral clustering framework was proposed as a dataset complexity measure that (1) naturally scales with the number of classes and (2) correlates strongly with downstream classification performance. In this work, we rigorously assess CSG behavior on standard knowledge graph link prediction benchmarks a multi class tail prediction task, using two key parameters governing its computation, M, the number of Monte Carlo sampled points per class, and K, the number of nearest neighbors in the embedding space. Contrary to the original claims, we find that (1) CSG is highly sensitive to the choice of K and therefore does not inherently scale with the number of target classes, and (2) CSG values exhibit weak or no correlation with established performance metrics such as mean reciprocal rank (MRR). Through experiments on FB15k 237, WN18RR, and other standard datasets, we demonstrate that CSG purported stability and generalization predictive power break down in link prediction settings. Our results highlight the need for more robust, classifier agnostic complexity measures in KG link prediction evaluation.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Evaluating Cumulative Spectral Gradient as a Complexity Measure

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Natural Language Actor-Critic: Scalable Off-Policy Learning in Language Space

Towards Active Synthetic Data Generation for Finetuning Language Models

AlignSAE: Concept-Aligned Sparse Autoencoders

Measuring What LLMs Think They Do: SHAP Faithfulness and Deployability on Financ...

BanglaSentNet: An Explainable Hybrid Deep Learning Framework for Multi-Aspect Se...

Навигация