What is a good matching of probability measures? A counterfactual lens on transport maps
2509.16027v1
stat.ML, cs.LG, math.ST, stat.ME, stat.TH
2025-09-23
Авторы:
Lucas De Lara, Luca Ganassali
Резюме на русском
## Контекст
Область исследования **статистики** и **машинного обучения** широко использует понятие **связывания вероятностных мер**. Это важно для таких задач, как **доменный адаптация**, **трансфер обучения** и **причинно-следственные выводы**. Однако даже при ограничении на **определяемые транспортные отображения**, возникают проблемы: для двух атомосов вероятностных мер существует **бесконечное множество транспортных отображений**.
Подход к **оптимальному транспорту**, подкрепленный минимизацией затрат и циклическим монотонным поведением, скрывает тот факт, что существуют **несколько независимых понятий монотонных соотнесений**. Мы предлагаем анализировать эти подходы и их **структурные свойства**.
Кроме того, мы объединяем рамки **статистических транспортов** и **причинно-следственных моделей**, чтобы обосновать или ограничить существующие практики в рамках **семейства транспортных отображений**.
## Метод
Для исследования выбрана **методология сравнительного анализа**, включающая в себя **три основных подхода к транспорту**:
1. **Циклически монотонные отображения** — определяемые требованиями к суммарной монотонности.
2. **Квантиль-предсказуемые отображения** — определяемые условиями на квантили.
3. **Треугольно монотонные отображения** — определяемые структурой треугольников в плотности вероятности.
Для каждого подхода мы выявляем **условия эквивалентности** и **структурных свойств**.
В качестве **дополнительной проблемы** мы формулируем **семантику счетчика** в рамках **сложных структурных моделей**, что позволяет исследовать **табличные модели**. Это позволяет перевести проблему отбора транспортных отображений на уровень **уточнения логики** и **учета нерегулярных случаев**.
## Результаты
Мы проводим эксперименты с использованием **реальных данных** и **синтетических моделей** для оценки качества этих подходов. Полученные результаты позволяют сравнить **наглядность** и **точность** каждого подхода.
Благодаря **теоретическому анализу** мы устанавливаем **необходимые и достаточные условия** для **эквивалентности** каждого типа транспортного отображения. Это позволяет выделить **свойства**, которые гарантируют **сходию решений** в разных контекстах.
## Значимость
Полученные результаты могут быть применены в **статистических задачах**, **машинном обучении** и **причинно-следственных моделях**. Основные **преимущества** включают:
1. **Уточнение логики причинно-следственных моделей**.
2. **Эстимация транспортных отображений** с учетом **нерегулярных случаев**.
3. **Объединение статист
Abstract
Coupling probability measures lies at the core of many problems in statistics
and machine learning, from domain adaptation to transfer learning and causal
inference. Yet, even when restricted to deterministic transports, such
couplings are not identifiable: two atomless marginals admit infinitely many
transport maps. The common recourse to optimal transport, motivated by cost
minimization and cyclical monotonicity, obscures the fact that several distinct
notions of multivariate monotone matchings coexist. In this work, we first
carry a comparative analysis of three constructions of transport maps:
cyclically monotone, quantile-preserving and triangular monotone maps. We
establish necessary and sufficient conditions for their equivalence, thereby
clarifying their respective structural properties. In parallel, we formulate
counterfactual reasoning within the framework of structural causal models as a
problem of selecting transport maps between fixed marginals, which makes
explicit the role of untestable assumptions in counterfactual reasoning. Then,
we are able to connect these two perspectives by identifying conditions on
causal graphs and structural equations under which counterfactual maps coincide
with classical statistical transports. In this way, we delineate the
circumstances in which causal assumptions support the use of a specific
structure of transport map. Taken together, our results aim to enrich the
theoretical understanding of families of transport maps and to clarify their
possible causal interpretations. We hope this work contributes to establishing
new bridges between statistical transport and causal inference.