End-to-End Deep Learning for Predicting Metric Space-Valued Outputs
2509.23544v1
stat.ML, cs.AI, cs.LG, stat.ME
2025-10-01
Авторы:
Yidong Zhou, Su I Iao, Hans-Georg Müller
Резюме на русском
## Контекст
Одним из основных задач регрессии является предсказание пространственно-векторных выходных данных, которые носят структурированный характер, например, вектора, матрицы или даже сети. Однако, существуют ситуации, когда выходные данные естественным образом моделируются как элементы геометрических пространств, не являющихся векторными (например, группы симметричноопределенных матриц плюс или функциональные пространства). Традиционные методы регрессии, опирающиеся на векторное пространство, не могут быть применены в таких случаях. Это создает необходимость в разработке методов, способных эффективно работать в метрических пространствах. Таким образом, задача предсказания выходных данных в метрических пространствах является важной и актуальной в многих областях, включая машинное обучение, анализ данных, геометрию и др.
## Метод
Мы предлагаем **End-to-End Metric Regression (E2M)**, новую архитектуру глубокого обучения, предназначенную для решения задач регрессии в метрических пространствах. Основная идея E2M заключается в использовании **взвешенных фрактельных средних** (Fréchet means) для предсказания выходных данных. Эти взвешенные средние формируются с помощью нейронной сети, которая вычисляет веса на основе входных данных. Эти веса определяют вклад каждого элемента множества выходных данных в финальное предсказание. Таким образом, E2M позволяет гибко адаптироваться к геометрии пространства выходных данных, не прибегая к ограничивающим параметрическим моделям. Метод E2M также включает в себя регуляризацию энтропии, чтобы обеспечить устойчивость и повысить точность предсказания в условиях неопределенности.
## Результаты
Мы провели обширные эксперименты с различными типами метрических пространств, включая пространство вероятностных распределений, пространство сетей и пространство симметрично определенных матриц. Мы сравнивали E2M с другими методами регрессии, включая традиционные и те, которые используют параметрические модели. Наши результаты показывают, что E2M показывает высокую точность и стабильность в предсказании выходных данных. Мы также проводили эксперименты на реальных данных, включая данные о человеческих распределениях смертности и сетях транспорта Нью-Йорка. В этих случаях E2M демонстрировал значительные преимущества по сравнению с другими методами.
## Значимость
Предложенная модель E2M имеет широкие приложения в области предсказания структурированных данных, включая прогнозирование распределений, анализ сетей, моделирование геометрических объектов и др. Одним из основных
Abstract
Many modern applications involve predicting structured, non-Euclidean outputs
such as probability distributions, networks, and symmetric positive-definite
matrices. These outputs are naturally modeled as elements of general metric
spaces, where classical regression techniques that rely on vector space
structure no longer apply. We introduce E2M (End-to-End Metric regression), a
deep learning framework for predicting metric space-valued outputs. E2M
performs prediction via a weighted Fr\'echet means over training outputs, where
the weights are learned by a neural network conditioned on the input. This
construction provides a principled mechanism for geometry-aware prediction that
avoids surrogate embeddings and restrictive parametric assumptions, while fully
preserving the intrinsic geometry of the output space. We establish theoretical
guarantees, including a universal approximation theorem that characterizes the
expressive capacity of the model and a convergence analysis of the
entropy-regularized training objective. Through extensive simulations involving
probability distributions, networks, and symmetric positive-definite matrices,
we show that E2M consistently achieves state-of-the-art performance, with its
advantages becoming more pronounced at larger sample sizes. Applications to
human mortality distributions and New York City taxi networks further
demonstrate the flexibility and practical utility of the framework.