Counterfactual Probabilistic Diffusion with Expert Models

2508.13355v1 cs.LG, cs.AI, stat.ME 2025-08-21
Авторы:

Wenhao Mu, Zhi Cao, Mehmed Uludag, Alexander Rodríguez

Резюме на русском

################################# ## Контекст ################################# Область исследования — прогнозирование контрфактических распределений в сложных динамических системах, которая является ключевой для научного моделирования и принятия решений в сферах, таких как общественное здравоохранение и медицина. Существующие методы часто основываются на точных оценках или чисто данными-ориентированных моделях, которые могут давать неточные результаты в условиях недостатка данных. Мы предлагаем новую фреймворк, основанное на процессе диффузии временных рядов, который интегрирует ведущие признаки из неточных экспертных моделей. Модель ODE-Diff объединяет механистические и данными-ориентированные подходы, обеспечивая более надежные и понятные методы для каузального вывода. ################################# ## Метод ################################# Метод ODE-Diff основывается на процессе диффузии временных рядов, в котором используется информация из экспертных моделей для создания структурированных признаков. Эти признаки используются в качестве вспомогательных подходов для улучшения прогноза временных рядов. Фреймворк состоит из нескольких ключевых этапов: 1. **Интеграция экспертных моделей**: Мы извлекаем сигналы из экспертных моделей, которые помогают предсказать динамику системы. 2. **Диффузия временных рядов**: Мы применяем процесс диффузии для преобразования данных, чтобы улучшить точность и добавить структуру. 3. **Обучение модели**: Мы обучаем модель с использованием смешанных данных, чтобы оптимизировать прогнозирование временных рядов. ################################# ## Результаты ################################# Мы проводили эксперименты с полусинтетическими данными ситуаций COVID-19, синтетическими вариантами фармакологических динамик и реальными случаями. Метод ODE-Diff показал высокую точность в точных прогнозах и распределениях. Он сравнивался с сильными базисными моделями и показал значительное улучшение в качестве предсказания. Эти результаты подтверждают эффективность нашего подхода в сложных ситуациях, когда данные ограниченны. ################################# ## Значимость ################################# Прогнозирование контрфактических распределений является важной задачей во многих областях, включая общественное здравоохранение, медицину и финансы. Метод ODE-Diff предлагает новый подход, который объединяет механизмы и данные, улучшая прогнозирование и возможности каузального вывода. Это может привести к значительным улучшениям в моделировании и принятии решений в различных сферах. ################################# ## Выводы ################################# Мы представили новую модель, ODE-Diff, которая использует диффузию временных рядов и структурированные признаки из экспертных моделей для улучшения прогнозирования временных рядов. Результаты показали, что наш подхо

Abstract

Predicting counterfactual distributions in complex dynamical systems is essential for scientific modeling and decision-making in domains such as public health and medicine. However, existing methods often rely on point estimates or purely data-driven models, which tend to falter under data scarcity. We propose a time series diffusion-based framework that incorporates guidance from imperfect expert models by extracting high-level signals to serve as structured priors for generative modeling. Our method, ODE-Diff, bridges mechanistic and data-driven approaches, enabling more reliable and interpretable causal inference. We evaluate ODE-Diff across semi-synthetic COVID-19 simulations, synthetic pharmacological dynamics, and real-world case studies, demonstrating that it consistently outperforms strong baselines in both point prediction and distributional accuracy.

Ссылки и действия

Связанные статьи

ProCause: Generating Counterfactual Outcomes to Evaluate Prescriptive Process Mo...

## Контекст Prescriptive Process Monitoring (PresPM) — это подполе Process Mining, которое сосредотачивается на оптимиза...

2025-09-05

Causal SHAP: Feature Attribution with Dependency Awareness through Causal Discov...

## Контекст Машинное обучение (ML) применяется все чаще в высокорисковых областях, таких как здравоохранение и финансы, ...

2025-09-05