DFW: A Novel Weighting Scheme for Covariate Balancing and Treatment Effect Estimation
2508.05215v1
cs.LG, stat.ME
2025-08-09
Авторы:
Ahmad Saeed Khan, Erik Schaffernicht, Johannes Andreas Stork
Резюме на русском
**Резюме**
Оценка каузальных эффектов из необъективных данных стала вызовом из-за селекционной биаса, вызывающего неоднородность распределений признаков между группами лечения. Методы взвешивания на основе оценки вероятности включения (propensity score weighting) широко используются для устранения этой проблемы, но их эффективность сильно зависит от качества оценки вероятности и данных. Например, обратное взвешивание вероятности (IPW) может привести к нестабильным весам при высокой дисперсии вероятности, что портит баланс признаков и точность оценки эффекта лечения.
В статье предложен метод **Deconfounding Factor Weighting (DFW)**, который использует деконфундинг-фактор для построения более стабильных весов. DFW ориентируется на менее зависимые от селекционной биаса объекты, уменьшая влияние высоко-зависимых, и формирует подпублика, более приближенную к выборке случайного контролируемого испытания (RCT). Метод гарантирует ограниченные веса, низкую дисперсию и лучший баланс признаков. Хотя DFW разработан для двойных лечений, он легко расширяется на множественные лечения, основываясь на оценке вероятности полученного лечения.
Исследования на реальных и синтетических данных показали, что DFW примечательно превосходит существующие методы, такие как IPW и CBPS, в балансе признаков и оценке эффекта лечения.
Abstract
Estimating causal effects from observational data is challenging due to
selection bias, which leads to imbalanced covariate distributions across
treatment groups. Propensity score-based weighting methods are widely used to
address this issue by reweighting samples to simulate a randomized controlled
trial (RCT). However, the effectiveness of these methods heavily depends on the
observed data and the accuracy of the propensity score estimator. For example,
inverse propensity weighting (IPW) assigns weights based on the inverse of the
propensity score, which can lead to instable weights when propensity scores
have high variance-either due to data or model misspecification-ultimately
degrading the ability of handling selection bias and treatment effect
estimation. To overcome these limitations, we propose Deconfounding Factor
Weighting (DFW), a novel propensity score-based approach that leverages the
deconfounding factor-to construct stable and effective sample weights. DFW
prioritizes less confounded samples while mitigating the influence of highly
confounded ones, producing a pseudopopulation that better approximates a RCT.
Our approach ensures bounded weights, lower variance, and improved covariate
balance.While DFW is formulated for binary treatments, it naturally extends to
multi-treatment settings, as the deconfounding factor is computed based on the
estimated probability of the treatment actually received by each sample.
Through extensive experiments on real-world benchmark and synthetic datasets,
we demonstrate that DFW outperforms existing methods, including IPW and CBPS,
in both covariate balancing and treatment effect estimation.
Ссылки и действия
Дополнительные ресурсы: