Factor Informed Double Deep Learning For Average Treatment Effect Estimation
2508.17136v1
stat.ML, cs.LG, math.ST, stat.ME, stat.TH, 62G08, 62G20
2025-08-27
Авторы:
Jianqing Fan, Soham Jana, Sanjeev Kulkarni, Qishuo Yin
Резюме на русском
## Контекст
Оценка среднего эффекта лечения (ATE) — важная задача в медицине, экономике и социальных науках, которая позволяет определять влияние некоторого лечения или воздействия на группу людей. Существуют сложности при оценке ATE, в том числе из-за высокой размерности данных, высокой корреляции признаков и существования спарших нелинейных эффектов в моделях пропensity и результата. Эти модели часто являются высоко-мерной и нетривиальной, что создает вызовы для существующих методов. Необходимо разработать метод, который может эффективно работать с такими характеристиками данных.
## Метод
Мы предлагаем Double Deep Learning подход, который объединяет недавно разработанные factor-augmented deep learning-based estimators, FAST-NN, для оценки результата и модели наиболее вероятности. FAST-NN делает это непараметрически, используя глубокие нейронные сети для выбора значимых признаков и адаптивного уменьшения размерности моделей. Основываясь на этом, мы предлагаем FIDDLE (Factor Informed Double Deep Learning Estimator), который использует augmented inverse propensity weighting (AIPW) для оценки ATE. Этот подход обеспечивает глубокую адаптивность для выбора признаков и моделирования, что дает ему высокую точность и гибкость.
## Результаты
Мы проводили ряд экспериментов на синтетических и реальных данных, показав высокую точность FIDDLE в оценке ATE. Мы использовали различные модели, включая сложные, высоко-мерные и спаршные. Наши результаты показали, что FIDDLE обеспечивает более точные оценки в сравнении с другими существующими методами, особенно когда размер данных и размерность признаков высоки. Мы также продемонстрировали, что FIDDLE поддерживает гибкость в работе с различными моделями и может восстанавливать ATE даже при потенциальной неверной модели.
## Значимость
Наш метод широко применим в медицинских исследованиях, экономических моделях и других областях, где важно оценить влияние внешних факторов на результаты. FIDDLE обеспечивает высокую точность и устойчивость при работе с высоко-мерными и спаршными данными, что делает его предпочтительным в сложных задачах. Благодаря использованию нейронных сетей, FIDDLE может адаптироваться к различным условиям данных, что делает его гибким и мощным инструментом.
## Выводы
Мы представили FIDDLE — новый подход к оценке ATE, который объединяет нейронные сети и factor-augmented deep learning. Этот метод доказал свою эффективность в сложных задачах, особенно если данные высоко-мерны. Мы планируем продолжать развивать этот подход, оптимизировав его для работы с более сложными моделями и применяя его в реальных задачах.
Abstract
We investigate the problem of estimating the average treatment effect (ATE)
under a very general setup where the covariates can be high-dimensional, highly
correlated, and can have sparse nonlinear effects on the propensity and outcome
models. We present the use of a Double Deep Learning strategy for estimation,
which involves combining recently developed factor-augmented deep
learning-based estimators, FAST-NN, for both the response functions and
propensity scores to achieve our goal. By using FAST-NN, our method can select
variables that contribute to propensity and outcome models in a completely
nonparametric and algorithmic manner and adaptively learn low-dimensional
function structures through neural networks. Our proposed novel estimator,
FIDDLE (Factor Informed Double Deep Learning Estimator), estimates ATE based on
the framework of augmented inverse propensity weighting AIPW with the
FAST-NN-based response and propensity estimates. FIDDLE consistently estimates
ATE even under model misspecification and is flexible to also allow for
low-dimensional covariates. Our method achieves semiparametric efficiency under
a very flexible family of propensity and outcome models. We present extensive
numerical studies on synthetic and real datasets to support our theoretical
guarantees and establish the advantages of our methods over other traditional
choices, especially when the data dimension is large.