Estimating Heterogeneous Causal Effect on Networks via Orthogonal Learning
2509.18484v1
stat.ML, cs.LG
2025-09-25
Авторы:
Yuanchen Wu, Yubai Yuan
Резюме на русском
#### Контекст
Оценка гетерогенных причинных эффектов на сетях является важной задачей для научных исследований и практических приложений. Несмотря на традиционную модель, предполагающую независимость отношений между единицами в сети (SUTVA), на сегодняшний день существуют условия, при которых взаимодействие между единицами может оказывать влияние на их результаты. Такие ситуации часто встречаются в областях эпидемиологии, политологии, экономики и других. Оценка как прямых, так и затруднительных эффектов на сетях является ключевым элементом в понимании социальных, экономических и политических процессов. Однако оценка этих эффектов сталкивается с несколькими проблемами. Во-первых, причинные эффекты гетерогенны и могут различаться в зависимости от фичей единиц и структуры сети. Во-вторых, соседние единицы часто связаны друг с другом, что создает потенциальную конфузию между структурными зависимостями и причинными эффектами.
#### Метод
Мы предлагаем двухэтапный подход для оценки гетерогенных причинных эффектов на сетях. В первой стадии используется графовые нейронные сети (Graph Neural Networks, GNNs) для оценки независимых компонент (nuisance components), которые зависят от сложной структуры сети. Во второй стадии мы используем эти оценки, чтобы корректировать зависимости в сети и оценивать причинные эффекты с помощью новой модели взаимодействия (interference model), основанной на аттестации (attention-based). Мы используем Neyman-ортогональность и кросс-фиттинг (cross-fitting) для обеспечения устойчивости оценок причинных эффектов к погрешностям в моделировании независимых компонент. Этот подход позволяет получить более точные и надёжные оценки причинных эффектов, учитывая сложности сетевых зависимостей.
#### Результаты
Мы проводили эксперименты с искусственными и реальными сетевыми данными, чтобы проверить эффективность нашего подхода. Мы сравнивали нашу модель с другими подходами, в том числе с традиционными методами оценки причинных эффектов и с новыми, основанными на графах. Наши результаты показали, что данный подход превосходит другие методы по точности оценки причинных эффектов и их гетерогенности. Также мы продемонстрировали, что наша модель может успешно идентифицировать влиятельные соседние единицы и восстанавливать знак затруднительных эффектов.
#### Значимость
Предлагаемый подход может быть применен в различных областях, включая эпидемиологию, политологию, экономику и социальные науки. Он позволяет учитывать сложности, связанные с зависимостями в сетях и гетерогенностью причинных эффектов. Наши результаты открывают новые возможности для понима
Abstract
Estimating causal effects on networks is important for both scientific
research and practical applications. Unlike traditional settings that assume
the Stable Unit Treatment Value Assumption (SUTVA), interference allows an
intervention/treatment on one unit to affect the outcomes of others.
Understanding both direct and spillover effects is critical in fields such as
epidemiology, political science, and economics. Causal inference on networks
faces two main challenges. First, causal effects are typically heterogeneous,
varying with unit features and local network structure. Second, connected units
often exhibit dependence due to network homophily, creating confounding between
structural correlations and causal effects. In this paper, we propose a
two-stage method to estimate heterogeneous direct and spillover effects on
networks. The first stage uses graph neural networks to estimate nuisance
components that depend on the complex network topology. In the second stage, we
adjust for network confounding using these estimates and infer causal effects
through a novel attention-based interference model. Our approach balances
expressiveness and interpretability, enabling downstream tasks such as
identifying influential neighborhoods and recovering the sign of spillover
effects. We integrate the two stages using Neyman orthogonalization and
cross-fitting, which ensures that errors from nuisance estimation contribute
only at higher order. As a result, our causal effect estimates are robust to
bias and misspecification in modeling causal effects under network
dependencies.
Ссылки и действия
Дополнительные ресурсы: