Assessing local deformation and computing scalar curvature with nonlinear conformal regularization of decoders

2508.20413v1 cs.LG, cs.AI, 68T07 2025-08-29
Авторы:

Benjamin Couéraud, Vikram Sunkara, Christof Schütte

Резюме на русском

## Контекст Одна из основных задач в области машинного обучения — выявление основных факторов, объясняющих данные. Это ключевая проблема во многих приложениях, извлекающих полезные структуры из высокомерных данных. Автокодировщики (autoencoders) — это мощный инструмент для решения этой задачи. Они состоят из двух основных компонентов: энкодера (кодировщика), который преобразует входные данные в низкомерное представление, и декодера (декодировщика), позволяющего восстановить исходные данные из этого представления. Таким образом, автокодировщики позволяют учить множество низкомерных множеств, представляющих оптимальные низкомерные репрезентации входных данных. Однако, несмотря на их эффективность, в стандартных автокодировщиках нерегулируемость множеств обучения может привести к локальным деформациям и нечеткости манифолтов. Данная статья предлагает новую методологию — **nonlinear conformal regularization** — для решения этой проблемы. ## Метод В этой работе предлагается новый подход к геометрической регуляризации в автокодировщиках. **Nonlinear conformal regularization** (NCR) добавляет к традиционной архитектуре автокодировщика новый компонент — **conformal factor**. Это скалярное поле, которое измеряет локальные деформации, возникающие при преобразовании низкомерного множества обратно в исходное пространство. Регуляризатор выражается с помощью нелинейного распределения, что дает гибкость в учете локальных деформаций. Эта техника также позволяет вычислить **scalar curvature** (геометрическую кривизну) манифолта, учитывая локальные дисторсии. Архитектура NCR включает в себя усовершенствованный декодер с конформирующим регуляризатором, который обеспечивает не только эффективное учеть локальных деформаций, но и позволяет оценивать геометрические свойства обученного множества. ## Результаты Эксперименты проводились на двух датасетах: **Swiss roll** и **CelebA**. На **Swiss roll** демонстрируется как NCR позволяет сохранить локальную структуру данных при разложении на множество, уменьшая дисторсии и улучшая точность. На **CelebA** NCR используется для измерения геометрической кривизны низкомерных поверхностей, полученных с помощью автокодировщика. На графиках показаны различные метрики локальных деформаций, включая scalar curvature, что демонстрирует то, как NCR позволяет контролировать и измерять геометрические свойства данных. Результаты показывают значительное улучшение точности и стабильности в сравнении с базовым автокодировщиком. ## Значимость NCR может быть применено в различных приложениях, где геометрические свойства множества играют ключевую роль, таких как **геометрическая аналитика**,

Abstract

One aim of dimensionality reduction is to discover the main factors that explain the data, and as such is paramount to many applications. When working with high dimensional data, autoencoders offer a simple yet effective approach to learn low-dimensional representations. The two components of a general autoencoder consist first of an encoder that maps the observed data onto a latent space; and second a decoder that maps the latent space back to the original observation space, which allows to learn a low-dimensional manifold representation of the original data. In this article, we introduce a new type of geometric regularization for decoding maps approximated by deep neural networks, namely nonlinear conformal regularization. This regularization procedure permits local variations of the decoder map and comes with a new scalar field called conformal factor which acts as a quantitative indicator of the amount of local deformation sustained by the latent space when mapped into the original data space. We also show that this regularization technique allows the computation of the scalar curvature of the learned manifold. Implementation and experiments on the Swiss roll and CelebA datasets are performed to illustrate how to obtain these quantities from the architecture.

Ссылки и действия

Связанные статьи

Beyond Backpropagation: Exploring Innovative Algorithms for Energy-Efficient Dee...

## Контекст В последние годы глубокие нейронные сети (DNNs) стали ключевым инструментом в многих областях искусственног...

2025-09-25

rETF-semiSL: Semi-Supervised Learning for Neural Collapse in Temporal Data

## Контекст Глубокие нейронные сети (DNNs), применяемые к задачам классификации временных рядов, должны эффективно харак...

2025-08-15