What is a good matching of probability measures? A counterfactual lens on transport maps

2509.16027v1 stat.ML, cs.LG, math.ST, stat.ME, stat.TH 2025-09-23

Авторы:

Lucas De Lara, Luca Ganassali

Резюме на русском

## Контекст Область исследования **статистики** и **машинного обучения** широко использует понятие **связывания вероятностных мер**. Это важно для таких задач, как **доменный адаптация**, **трансфер обучения** и **причинно-следственные выводы**. Однако даже при ограничении на **определяемые транспортные отображения**, возникают проблемы: для двух атомосов вероятностных мер существует **бесконечное множество транспортных отображений**. Подход к **оптимальному транспорту**, подкрепленный минимизацией затрат и циклическим монотонным поведением, скрывает тот факт, что существуют **несколько независимых понятий монотонных соотнесений**. Мы предлагаем анализировать эти подходы и их **структурные свойства**. Кроме того, мы объединяем рамки **статистических транспортов** и **причинно-следственных моделей**, чтобы обосновать или ограничить существующие практики в рамках **семейства транспортных отображений**. ## Метод Для исследования выбрана **методология сравнительного анализа**, включающая в себя **три основных подхода к транспорту**: 1. **Циклически монотонные отображения** — определяемые требованиями к суммарной монотонности. 2. **Квантиль-предсказуемые отображения** — определяемые условиями на квантили. 3. **Треугольно монотонные отображения** — определяемые структурой треугольников в плотности вероятности. Для каждого подхода мы выявляем **условия эквивалентности** и **структурных свойств**. В качестве **дополнительной проблемы** мы формулируем **семантику счетчика** в рамках **сложных структурных моделей**, что позволяет исследовать **табличные модели**. Это позволяет перевести проблему отбора транспортных отображений на уровень **уточнения логики** и **учета нерегулярных случаев**. ## Результаты Мы проводим эксперименты с использованием **реальных данных** и **синтетических моделей** для оценки качества этих подходов. Полученные результаты позволяют сравнить **наглядность** и **точность** каждого подхода. Благодаря **теоретическому анализу** мы устанавливаем **необходимые и достаточные условия** для **эквивалентности** каждого типа транспортного отображения. Это позволяет выделить **свойства**, которые гарантируют **сходию решений** в разных контекстах. ## Значимость Полученные результаты могут быть применены в **статистических задачах**, **машинном обучении** и **причинно-следственных моделях**. Основные **преимущества** включают: 1. **Уточнение логики причинно-следственных моделей**. 2. **Эстимация транспортных отображений** с учетом **нерегулярных случаев**. 3. **Объединение статист

Abstract

Coupling probability measures lies at the core of many problems in statistics and machine learning, from domain adaptation to transfer learning and causal inference. Yet, even when restricted to deterministic transports, such couplings are not identifiable: two atomless marginals admit infinitely many transport maps. The common recourse to optimal transport, motivated by cost minimization and cyclical monotonicity, obscures the fact that several distinct notions of multivariate monotone matchings coexist. In this work, we first carry a comparative analysis of three constructions of transport maps: cyclically monotone, quantile-preserving and triangular monotone maps. We establish necessary and sufficient conditions for their equivalence, thereby clarifying their respective structural properties. In parallel, we formulate counterfactual reasoning within the framework of structural causal models as a problem of selecting transport maps between fixed marginals, which makes explicit the role of untestable assumptions in counterfactual reasoning. Then, we are able to connect these two perspectives by identifying conditions on causal graphs and structural equations under which counterfactual maps coincide with classical statistical transports. In this way, we delineate the circumstances in which causal assumptions support the use of a specific structure of transport map. Taken together, our results aim to enrich the theoretical understanding of families of transport maps and to clarify their possible causal interpretations. We hope this work contributes to establishing new bridges between statistical transport and causal inference.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

What is a good matching of probability measures? A counterfactual lens on transport maps

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Minimax-Optimal Two-Sample Test with Sliced Wasserstein

Foresighted Online Policy Optimization with Interference

Transfer Learning with Distance Covariance for Random Forest: Error Bounds and a...

One-shot Conditional Sampling: MMD meets Nearest Neighbors

Bias-variance Tradeoff in Tensor Estimation

Навигация