An Introduction to Sliced Optimal Transport
2508.12519v1
stat.ML, cs.AI, cs.LG, stat.CO, stat.ME
2025-08-20
Авторы:
Khai Nguyen
Резюме на русском
#### Контекст
Оптимальное транспортное погрешность (Optimal Transport, OT) — это важное понятие в теории меры и статистике, которое позволяет измерять расстояния и корреляции между двумя распределениями. Однако, стандартная OT часто сталкивается с проблемами вычислительной сложности, особенно при работе с высокомерными данными. Sliced Optimal Transport (SOT) — это подход, который использует транспорт в одномерном пространстве, чтобы приобрести больше вычислительной эффективности. Этот подход основывается на использовании целого ряда одномерных распределений для преобразования и сравнения более сложных мер. Несмотря на то, что SOT значительно упрощает вычисления, он сохраняет геометрическую структуру и мощь традиционного OT. Необходимость в SOT возникает из-за роста объема данных и сложности задач в машинном обучении, статистике и других дисциплинах.
#### Метод
SOT основывается на одномерной оптимальной транспортной задаче, которая легко решается. Главная идея заключается в том, чтобы разбить данные на подпространства размерности одной (например, вектора-столбца) и использовать одномерные распределения для вычисления дистанций. Эта техника обычно привносит сильные инварианты в многомерные данные, что позволяет их легко сравнивать. Основные инструменты, используемые в SOT, — это **Radon-преобразование**, которое преобразует меры в одномерные, и **Monte Carlo-эстимации**, которая позволяет вычислять скопированные меры. В SOT также используются сложные методы, такие как **non-linear slicing**, **weighted slicing** и **variational problems**, которые позволяют улучшить точность и скорость вычислений.
#### Результаты
В рамках экспериментов SOT был применен к многочисленным задачам, включая расчет расстояний, barycenters (средних распределений), оценивание градиентных потоков, вычисление керов и трансформаций для распределений. Набор данных в экспериментах включал как синтетические данные, так и реальные данные из машинного обучения, графического дизайна и компьютерного зрения. Результаты показали, что SOT не только значительно сокращает время расчета, но и сохраняет высокую точность по сравнению с классическим OT. Например, в задаче сопоставления распределений данных в графическом дизайне, SOT дал результаты, которые были близки к классическому OT, но с меньшим расходом ресурсов.
#### Значимость
SOT был применен в различных областях, включая машинное обучение, математическую статистику, компьютерные графики и компьютерное зрение. Он показал свою эффективность в задачах, таких как расчет расстояний между распределениями, вычисление barycenters, кластеризация данных и преобразования. Основное преиму
Abstract
Sliced Optimal Transport (SOT) is a rapidly developing branch of optimal
transport (OT) that exploits the tractability of one-dimensional OT problems.
By combining tools from OT, integral geometry, and computational statistics,
SOT enables fast and scalable computation of distances, barycenters, and
kernels for probability measures, while retaining rich geometric structure.
This paper provides a comprehensive review of SOT, covering its mathematical
foundations, methodological advances, computational methods, and applications.
We discuss key concepts of OT and one-dimensional OT, the role of tools from
integral geometry such as Radon transform in projecting measures, and
statistical techniques for estimating sliced distances. The paper further
explores recent methodological advances, including non-linear projections,
improved Monte Carlo approximations, statistical estimation techniques for
one-dimensional optimal transport, weighted slicing techniques, and
transportation plan estimation methods. Variational problems, such as minimum
sliced Wasserstein estimation, barycenters, gradient flows, kernel
constructions, and embeddings are examined alongside extensions to unbalanced,
partial, multi-marginal, and Gromov-Wasserstein settings. Applications span
machine learning, statistics, computer graphics and computer visions,
highlighting SOT's versatility as a practical computational tool. This work
will be of interest to researchers and practitioners in machine learning, data
sciences, and computational disciplines seeking efficient alternatives to
classical OT.