Estimating Heterogeneous Causal Effect on Networks via Orthogonal Learning

2509.18484v1 stat.ML, cs.LG 2025-09-25
Авторы:

Yuanchen Wu, Yubai Yuan

Резюме на русском

#### Контекст Оценка гетерогенных причинных эффектов на сетях является важной задачей для научных исследований и практических приложений. Несмотря на традиционную модель, предполагающую независимость отношений между единицами в сети (SUTVA), на сегодняшний день существуют условия, при которых взаимодействие между единицами может оказывать влияние на их результаты. Такие ситуации часто встречаются в областях эпидемиологии, политологии, экономики и других. Оценка как прямых, так и затруднительных эффектов на сетях является ключевым элементом в понимании социальных, экономических и политических процессов. Однако оценка этих эффектов сталкивается с несколькими проблемами. Во-первых, причинные эффекты гетерогенны и могут различаться в зависимости от фичей единиц и структуры сети. Во-вторых, соседние единицы часто связаны друг с другом, что создает потенциальную конфузию между структурными зависимостями и причинными эффектами. #### Метод Мы предлагаем двухэтапный подход для оценки гетерогенных причинных эффектов на сетях. В первой стадии используется графовые нейронные сети (Graph Neural Networks, GNNs) для оценки независимых компонент (nuisance components), которые зависят от сложной структуры сети. Во второй стадии мы используем эти оценки, чтобы корректировать зависимости в сети и оценивать причинные эффекты с помощью новой модели взаимодействия (interference model), основанной на аттестации (attention-based). Мы используем Neyman-ортогональность и кросс-фиттинг (cross-fitting) для обеспечения устойчивости оценок причинных эффектов к погрешностям в моделировании независимых компонент. Этот подход позволяет получить более точные и надёжные оценки причинных эффектов, учитывая сложности сетевых зависимостей. #### Результаты Мы проводили эксперименты с искусственными и реальными сетевыми данными, чтобы проверить эффективность нашего подхода. Мы сравнивали нашу модель с другими подходами, в том числе с традиционными методами оценки причинных эффектов и с новыми, основанными на графах. Наши результаты показали, что данный подход превосходит другие методы по точности оценки причинных эффектов и их гетерогенности. Также мы продемонстрировали, что наша модель может успешно идентифицировать влиятельные соседние единицы и восстанавливать знак затруднительных эффектов. #### Значимость Предлагаемый подход может быть применен в различных областях, включая эпидемиологию, политологию, экономику и социальные науки. Он позволяет учитывать сложности, связанные с зависимостями в сетях и гетерогенностью причинных эффектов. Наши результаты открывают новые возможности для понима

Abstract

Estimating causal effects on networks is important for both scientific research and practical applications. Unlike traditional settings that assume the Stable Unit Treatment Value Assumption (SUTVA), interference allows an intervention/treatment on one unit to affect the outcomes of others. Understanding both direct and spillover effects is critical in fields such as epidemiology, political science, and economics. Causal inference on networks faces two main challenges. First, causal effects are typically heterogeneous, varying with unit features and local network structure. Second, connected units often exhibit dependence due to network homophily, creating confounding between structural correlations and causal effects. In this paper, we propose a two-stage method to estimate heterogeneous direct and spillover effects on networks. The first stage uses graph neural networks to estimate nuisance components that depend on the complex network topology. In the second stage, we adjust for network confounding using these estimates and infer causal effects through a novel attention-based interference model. Our approach balances expressiveness and interpretability, enabling downstream tasks such as identifying influential neighborhoods and recovering the sign of spillover effects. We integrate the two stages using Neyman orthogonalization and cross-fitting, which ensures that errors from nuisance estimation contribute only at higher order. As a result, our causal effect estimates are robust to bias and misspecification in modeling causal effects under network dependencies.

Ссылки и действия