Revisiting Multivariate Time Series Forecasting with Missing Values

2509.23494v1 cs.LG, cs.AI, stat.ML 2025-10-01

Авторы:

Jie Yang, Yifan Hu, Kexin Zhang, Luyang Niu, Yushun Dong, Philip S. Yu, Kaize Ding

Резюме на русском

## Контекст Временные ряды — это важный источник данных, используемый в различных областях, включая финансы, здравоохранение и промышленность. Однако реальные временные ряды часто содержат пропущенные значения, что создает серьезные вызовы для моделирования и прогнозирования. Многие текущие методы применяют последовательный подход: сначала исправляют пропуски (imputation), а затем прогнозируют (prediction). Однако этот подход не учитывает, что пропуски могут быть неточно импультрованы, что приводит к подрыву достоверности прогнозов. Эта проблема требует изменить подход к моделированию временных рядов с пропусками. ## Метод Методология предлагаемого подхода основана на идее информационного бутлета (Information Bottleneck, IB). Разработанный фреймворк, названный **Consistency-Regularized Information Bottleneck (CRIB)**, не зависит от импультрования пропусков. Вместо этого он напрямую прогнозирует из частично наблюдаемых временных рядов. Основные компоненты CRIB: 1. **Unified-Variate Attention Mechanism** — позволяет учитывать взаимосвязи между различными признаками временных рядов. 2. **Consistency Regularization** — улучшает стабильность и точность прогноза, акцентуясь на надежных сигналах в данных. 3. **End-to-End Learning** — обеспечивает прямое учитывание ошибок в прогнозе без дополнительных моделей для импультрования пропусков. ## Результаты Статья представляет результаты экспериментов на четырёх реальных датасетах, в том числе банковских, здравоохранения и промышленности. Обучавшаяся с помощью CRIB модель показала стабильно высокую точность прогноза даже при высоких процентах пропусков в данных. Эксперименты показали, что CRIB оказывается эффективной в сравнении с традиционными методами, построенными на импультровании пропусков. ## Значимость Предлагаемый подход имеет широкие применения в областях, где существует большое количество временных рядов с пропусками, включая здравоохранение, финансы и промышленные процессы. Он не только улучшает точность прогнозов, но и устраняет зависимость от неточного импультрования пропусков. Это делает CRIB более надежным и универсальным инструментом для прогнозирования временных рядов. ## Выводы Результаты исследования подтверждают, что CRIB является эффективным подходом к разрешению проблемы пропусков в временных рядах. Будущие исследования будут фокусироваться на расширении модели для более сложных структур временных рядов и интеграции с другими методами машинного обучения.

Abstract

Missing values are common in real-world time series, and multivariate time series forecasting with missing values (MTSF-M) has become a crucial area of research for ensuring reliable predictions. To address the challenge of missing data, current approaches have developed an imputation-then-prediction framework that uses imputation modules to fill in missing values, followed by forecasting on the imputed data. However, this framework overlooks a critical issue: there is no ground truth for the missing values, making the imputation process susceptible to errors that can degrade prediction accuracy. In this paper, we conduct a systematic empirical study and reveal that imputation without direct supervision can corrupt the underlying data distribution and actively degrade prediction accuracy. To address this, we propose a paradigm shift that moves away from imputation and directly predicts from the partially observed time series. We introduce Consistency-Regularized Information Bottleneck (CRIB), a novel framework built on the Information Bottleneck principle. CRIB combines a unified-variate attention mechanism with a consistency regularization scheme to learn robust representations that filter out noise introduced by missing values while preserving essential predictive signals. Comprehensive experiments on four real-world datasets demonstrate the effectiveness of CRIB, which predicts accurately even under high missing rates. Our code is available in https://github.com/Muyiiiii/CRIB.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Revisiting Multivariate Time Series Forecasting with Missing Values

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Single-Round Scalable Analytic Federated Learning

Does Flatness imply Generalization for Logistic Loss in Univariate Two-Layer ReL...

Multi-view diffusion geometry using intertwined diffusion trajectories

A Diffusion Model Framework for Maximum Entropy Reinforcement Learning

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainab...

Навигация