Sensitivity Analysis to Unobserved Confounding with Copula-based Normalizing Flows

2508.08752v1 stat.ME, cs.LG, stat.ML 2025-08-14
Авторы:

Sourabh Balgi, Marc Braun, Jose M. Peña, Adel Daoud

Резюме на русском

## Контекст Исследование работы адресуется проблеме **сенситивности анализа к невидимому вмешательству** при казуальных выводах. Управляемая связь между причиной и результатом часто затухает из-за невидимого вмешательства, которое не учтено в модели. Это приводит к недооценке или переоценке силы причинно-следственной связи. Проблема становится особенно актуальной при работе с реальными данными, где многие факторы остаются незамеченными. Целью работы является разработка метода, позволяющего оценивать ограничивающие границы силы причинно-следственной связи в условиях невидимого вмешательства, используя моделирование на основе копул и нормализующих потоков. ## Метод Метод основывается на **копуле-основанном нормализующем потоке**, представленном в виде $\rho$-GNF ($\rho$-Gaussian Normalizing Flow). Значение параметра $\rho \in [-1, +1]$ определяет степень невидимого вмешательства, которая описывается как гауссова копула. Это позволяет вычислять **среднюю причинно-следственную эффективность (ACE)** в зависимости от $\rho$, учитывая различные уровни невидимого вмешательства. Результатом работы является **$\rho$-курвa**, показывающая диапазон ACE в зависимости от предположений о $\rho$. Метод также расширен на **байесовскую версию**, которая позволяет использовать предварительную информацию о $\rho$ для вычисления **постепенного распределения ACE** и определения **уверенности интервалов**. ## Результаты Эксперименты проводились на **симулированных и реальных данных**. Обнаружено, что $\rho$-GNF позволяет точно определять границы ACE в условиях различных уровней невидимого вмешательства. Этот подход демонстрирует высокую точность в сравнении с другими методами. Байесовская версия позволяет извлекать более подробные информационные интервалы для ACE, учитывая предварительные знания о $\rho$. Эксперименты показали, что $\rho$-GNF может обеспечивать более точные оценки причинно-следственных связей, даже при несовершенных данных. ## Значимость Разработанный подход может быть применен в политической экономии, экологии, медицине и других областях, где важно корректно оценивать причинно-следственные связи в условиях недостаточности информации. Одним из преимуществ является **гибкость** в учете различных уровней невидимого вмешательства. **Потенциальное влияние** заключается в улучшении качества выводов в ситуациях, когда невидимое вмешательство является значительной проблемой. ## Выводы Работа предлагает новый, эффективный подход к сенситивности анализа в условиях невидимого вмешательства. **Основные достижения** состоят в разработке $\rho$-GNF и его баYESовской версии. **Б

Abstract

We propose a novel method for sensitivity analysis to unobserved confounding in causal inference. The method builds on a copula-based causal graphical normalizing flow that we term $\rho$-GNF, where $\rho \in [-1,+1]$ is the sensitivity parameter. The parameter represents the non-causal association between exposure and outcome due to unobserved confounding, which is modeled as a Gaussian copula. In other words, the $\rho$-GNF enables scholars to estimate the average causal effect (ACE) as a function of $\rho$, accounting for various confounding strengths. The output of the $\rho$-GNF is what we term the $\rho_{curve}$, which provides the bounds for the ACE given an interval of assumed $\rho$ values. The $\rho_{curve}$ also enables scholars to identify the confounding strength required to nullify the ACE. We also propose a Bayesian version of our sensitivity analysis method. Assuming a prior over the sensitivity parameter $\rho$ enables us to derive the posterior distribution over the ACE, which enables us to derive credible intervals. Finally, leveraging on experiments from simulated and real-world data, we show the benefits of our sensitivity analysis method.

Ссылки и действия