Revisiting Multivariate Time Series Forecasting with Missing Values
2509.23494v1
cs.LG, cs.AI, stat.ML
2025-10-01
Авторы:
Jie Yang, Yifan Hu, Kexin Zhang, Luyang Niu, Yushun Dong, Philip S. Yu, Kaize Ding
Резюме на русском
## Контекст
Временные ряды — это важный источник данных, используемый в различных областях, включая финансы, здравоохранение и промышленность. Однако реальные временные ряды часто содержат пропущенные значения, что создает серьезные вызовы для моделирования и прогнозирования. Многие текущие методы применяют последовательный подход: сначала исправляют пропуски (imputation), а затем прогнозируют (prediction). Однако этот подход не учитывает, что пропуски могут быть неточно импультрованы, что приводит к подрыву достоверности прогнозов. Эта проблема требует изменить подход к моделированию временных рядов с пропусками.
## Метод
Методология предлагаемого подхода основана на идее информационного бутлета (Information Bottleneck, IB). Разработанный фреймворк, названный **Consistency-Regularized Information Bottleneck (CRIB)**, не зависит от импультрования пропусков. Вместо этого он напрямую прогнозирует из частично наблюдаемых временных рядов. Основные компоненты CRIB:
1. **Unified-Variate Attention Mechanism** — позволяет учитывать взаимосвязи между различными признаками временных рядов.
2. **Consistency Regularization** — улучшает стабильность и точность прогноза, акцентуясь на надежных сигналах в данных.
3. **End-to-End Learning** — обеспечивает прямое учитывание ошибок в прогнозе без дополнительных моделей для импультрования пропусков.
## Результаты
Статья представляет результаты экспериментов на четырёх реальных датасетах, в том числе банковских, здравоохранения и промышленности. Обучавшаяся с помощью CRIB модель показала стабильно высокую точность прогноза даже при высоких процентах пропусков в данных. Эксперименты показали, что CRIB оказывается эффективной в сравнении с традиционными методами, построенными на импультровании пропусков.
## Значимость
Предлагаемый подход имеет широкие применения в областях, где существует большое количество временных рядов с пропусками, включая здравоохранение, финансы и промышленные процессы. Он не только улучшает точность прогнозов, но и устраняет зависимость от неточного импультрования пропусков. Это делает CRIB более надежным и универсальным инструментом для прогнозирования временных рядов.
## Выводы
Результаты исследования подтверждают, что CRIB является эффективным подходом к разрешению проблемы пропусков в временных рядах. Будущие исследования будут фокусироваться на расширении модели для более сложных структур временных рядов и интеграции с другими методами машинного обучения.
Abstract
Missing values are common in real-world time series, and multivariate time
series forecasting with missing values (MTSF-M) has become a crucial area of
research for ensuring reliable predictions. To address the challenge of missing
data, current approaches have developed an imputation-then-prediction framework
that uses imputation modules to fill in missing values, followed by forecasting
on the imputed data. However, this framework overlooks a critical issue: there
is no ground truth for the missing values, making the imputation process
susceptible to errors that can degrade prediction accuracy. In this paper, we
conduct a systematic empirical study and reveal that imputation without direct
supervision can corrupt the underlying data distribution and actively degrade
prediction accuracy. To address this, we propose a paradigm shift that moves
away from imputation and directly predicts from the partially observed time
series. We introduce Consistency-Regularized Information Bottleneck (CRIB), a
novel framework built on the Information Bottleneck principle. CRIB combines a
unified-variate attention mechanism with a consistency regularization scheme to
learn robust representations that filter out noise introduced by missing values
while preserving essential predictive signals. Comprehensive experiments on
four real-world datasets demonstrate the effectiveness of CRIB, which predicts
accurately even under high missing rates. Our code is available in
https://github.com/Muyiiiii/CRIB.
Ссылки и действия
Дополнительные ресурсы: