Transforming Causality: Transformer-Based Temporal Causal Discovery with Prior Knowledge Integration
2508.15928v1
cs.LG, stat.ML
2025-08-25
Авторы:
Jihua Huang, Yi Yao, Ajay Divakaran
Резюме на русском
## Контекст
Исследование причинно-следственных связей во временных рядах является ключевым заданием в различных областях, таких как медицина, финансы и инженерия. Однако существуют две главные проблемы: сложные нелинейные зависимости и спуриовые корреляции, которые сделали традиционные методы менее эффективными. Необходимо разработать метод, который может обнаруживать причинные связи в нетривиальных ситуациях, с учетом нетопологических связей и многоуровневых зависимостей. Наша мотивация заключается в создании метода, который бы стал более точным и устойчивым в распознавании причинных связей в различных практических задачах.
## Метод
Мы предлагаем использовать Transformer-based time-series forecaster, который может обнаруживать нелинейные зависимости во временных рядах. Форекастер имеет несколько слоёв, что позволяет ему построить глубокий анализ зависимостей в данных. Чтобы определить причинные связи и временные задержки, мы используем градиентный анализ на выходных данных модели. Также, мы внедрили механизм подключения предварительных знаний, основывающийся на маскировании внимания (attention masking). Этот механизм позволяет постоянно исключать нежелательные причинные связи на разных уровнях модели, что улучшает её устойчивость и точность.
## Результаты
Мы проверили нашу модель на нескольких стандартных наборах данных, включая Google Stock Price и MSR Body Sensor Data. Мы сравнивали нашу модель с другими современными методами, такими как NOTEARS и GCL. Наши результаты показали, что Transformer-based forecaster показал 12.8% выигрыш в F1-меру по сравнению с другими методами, а точность оценки временных задержек достигла 98.9%. Эти результаты подчеркивают эффективность нашего подхода в задачах обнаружения причинных связей.
## Значимость
Мы предлагаем новый подход к обнаружению причинных связей в временных рядах, который может быть применен в таких областях, как медицинское мониторинго, финансовый анализ и прогнозирование биологических процессов. Наш метод показал себя как более точный и устойчивый по сравнению с другими существующими. Из-за того, что он использует Transformer-based архитектуру и механизмы подключения предварительных знаний, он может быть применён в сложных ситуациях, где другие модели могут представлять собой проблемы.
## Выводы
Мы представили новую модель для обнаружения причинных связей во временных рядах, использующую Transformer-based forecaster и механизмы маскирования внимания. Мы продемонстрировали, что наш подход значительно улучшает точность и устойчивость в задачах обнаружения причинных связей. Наше исследование открывает новые пути для будущих исследований в этой области, вкл
Abstract
We introduce a novel framework for temporal causal discovery and inference
that addresses two key challenges: complex nonlinear dependencies and spurious
correlations. Our approach employs a multi-layer Transformer-based time-series
forecaster to capture long-range, nonlinear temporal relationships among
variables. After training, we extract the underlying causal structure and
associated time lags from the forecaster using gradient-based analysis,
enabling the construction of a causal graph. To mitigate the impact of spurious
causal relationships, we introduce a prior knowledge integration mechanism
based on attention masking, which consistently enforces user-excluded causal
links across multiple Transformer layers. Extensive experiments show that our
method significantly outperforms other state-of-the-art approaches, achieving a
12.8% improvement in F1-score for causal discovery and 98.9% accuracy in
estimating causal lags.
Ссылки и действия
Дополнительные ресурсы: