DFW: A Novel Weighting Scheme for Covariate Balancing and Treatment Effect Estimation

2508.05215v1 cs.LG, stat.ME 2025-08-09
Авторы:

Ahmad Saeed Khan, Erik Schaffernicht, Johannes Andreas Stork

Резюме на русском

**Резюме** Оценка каузальных эффектов из необъективных данных стала вызовом из-за селекционной биаса, вызывающего неоднородность распределений признаков между группами лечения. Методы взвешивания на основе оценки вероятности включения (propensity score weighting) широко используются для устранения этой проблемы, но их эффективность сильно зависит от качества оценки вероятности и данных. Например, обратное взвешивание вероятности (IPW) может привести к нестабильным весам при высокой дисперсии вероятности, что портит баланс признаков и точность оценки эффекта лечения. В статье предложен метод **Deconfounding Factor Weighting (DFW)**, который использует деконфундинг-фактор для построения более стабильных весов. DFW ориентируется на менее зависимые от селекционной биаса объекты, уменьшая влияние высоко-зависимых, и формирует подпублика, более приближенную к выборке случайного контролируемого испытания (RCT). Метод гарантирует ограниченные веса, низкую дисперсию и лучший баланс признаков. Хотя DFW разработан для двойных лечений, он легко расширяется на множественные лечения, основываясь на оценке вероятности полученного лечения. Исследования на реальных и синтетических данных показали, что DFW примечательно превосходит существующие методы, такие как IPW и CBPS, в балансе признаков и оценке эффекта лечения.

Abstract

Estimating causal effects from observational data is challenging due to selection bias, which leads to imbalanced covariate distributions across treatment groups. Propensity score-based weighting methods are widely used to address this issue by reweighting samples to simulate a randomized controlled trial (RCT). However, the effectiveness of these methods heavily depends on the observed data and the accuracy of the propensity score estimator. For example, inverse propensity weighting (IPW) assigns weights based on the inverse of the propensity score, which can lead to instable weights when propensity scores have high variance-either due to data or model misspecification-ultimately degrading the ability of handling selection bias and treatment effect estimation. To overcome these limitations, we propose Deconfounding Factor Weighting (DFW), a novel propensity score-based approach that leverages the deconfounding factor-to construct stable and effective sample weights. DFW prioritizes less confounded samples while mitigating the influence of highly confounded ones, producing a pseudopopulation that better approximates a RCT. Our approach ensures bounded weights, lower variance, and improved covariate balance.While DFW is formulated for binary treatments, it naturally extends to multi-treatment settings, as the deconfounding factor is computed based on the estimated probability of the treatment actually received by each sample. Through extensive experiments on real-world benchmark and synthetic datasets, we demonstrate that DFW outperforms existing methods, including IPW and CBPS, in both covariate balancing and treatment effect estimation.

Ссылки и действия