📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня
Авторы:

Charlotte Beylier, Parvaneh Joharinad, Jürgen Jost, Nahid Torbati

## Контекст Область данного исследования относится к методам оценки эффективности техник сжатия размерности и определению природы геометрических свойств данных. Несмотря на развитие методов сжатия размерности, таких как PCA и t-SNE, остается трудность оценки, насколько эффективно эти методы сохраняют геометрию исходных данных. Зачастую, эти методы используются без понятных критериев для определения их качества. Также, оценка природы геометрических свойств задачи чрезвычайно важна для понимания структуры данных. Данная работа предлагает новый подход, основанный на концепции кривизны, для оценки эффективности техник сжатия размерности и определения природы геометрических свойств данных. ## Метод Предлагаемый метод основывается на абстрактной концепции кривизны, которая позволяет построить геометрический профиль дискретных метрических пространств. Эта концепция основывается на метрических отношениях между тройками точек в пространстве. Основным инструментом является многообразие тензоров, построенное на основе субдифференциала кривизны. Этот многообразийный подход позволяет измерить не только глобальные характеристики пространства, но и локальные метрические отношения. Для применения этого метода используется цикл повторяющихся вычислений над многообразием, чтобы получить кривую геометрического профиля пространства. ## Результаты Используя предложенный подход, авторы провели эксперименты на различных данных, включая сетевые данные и данные с высокой размерностью. Оценка эффективности техник сжатия размерности производилась с помощью меры, основанной на кривизне, что позволило получить четкое понятие о том, насколько эффективно методы сохраняют геометрические свойства данных. Также, был получен алгоритм для оценки природы геометрических свойств данных, включая оценку примерной размерности пространства. Эксперименты показали, что данный подход дает достаточно точные оценки размерности и способен отличать качество различных методов сжатия размерности. ## Значимость Предлагаемый подход имеет широкое применение в области геометрии данных. Он может применяться для оценки эффективности различных методов сжатия размерности, например, PCA, t-SNE и UMAP. Также, подход может быть использован для исследования геометрии в подмножествах данных, таких как графы и сети, что дает новые возможности для исследования структуры графов. Этот подход также может быть применен в машинном обучении для лучшего понимания качества данных и выбора подходящих методов сжатия. ## Выводы Результаты исследовани
Annotation:
Utilizing recently developed abstract notions of sectional curvature, we introduce a method for constructing a curvature-based geometric profile of discrete metric spaces. The curvature concept that we use here captures the metric relations between triples of points and other points. More significantly, based on this curvature profile, we introduce a quantitative measure to evaluate the effectiveness of data representations, such as those produced by dimensionality reduction techniques. Furtherm...
ID: 2509.13385v1 cs.CV, cs.DM, cs.LG, 51K05 (primary) 57-08, 53Z50, 55U10 (secondary), G.2.2