Wavelet Mixture of Experts for Time Series Forecasting

2508.08825v1 cs.LG, cs.AI 2025-08-14
Авторы:

Zheng Zhou, Yu-Jie Xiong, Jia-Chen Zhang, Chun-Ming Xia, Xi-Jiong Xie

Резюме на русском

## Контекст Временные ряды широко используются в различных областях, включая экономику, здравоохранение, промышленность и среда. Их предсказание является ключевым заданием, которое помогает принять обоснованные решения в условиях неопределенности. Несмотря на развитие методов машинного обучения, существуют значительные проблемы. Трансформеры, несмотря на высокую точность, требуют больших объемов памяти и вычислительных ресурсов. Многослойные перцептроны (MLP), хотя эффективнее, сталкиваются с трудностями при работе с многоканальными зависимостями. Эти ограничения могут привести к неточным прогнозам или высоким затратам на вычисления. Эти мотивации подготовили почву для развития моделей, которые сочетают точность, эффективность и удобство применения. ## Метод Модель WaveTS-B основывается на волетной трансформации и многослойном перцептроне (MLP) для обработки временных рядов. Она использует волетные преобразования для выделения периодических и нестационарных функций в данных. Далее, вводится стратегия кластеризации каналов, основанная на фреймворке Mixture of Experts (MoE). Эта стратегия включает в себя механизм гейтинга и экспертный сетевой модуль, который позволяет эффективно управлять зависимостями между каналами в многоканальных данных. Модель WaveTS-M, развитая на базе WaveTS-B, специализируется на предсказании многоканальных временных рядов. Для обеспечения эффективности, модели используют легковесную архитектуру, позволяющую сохранить высокую точность при значительном сокращении числа параметров. ## Результаты Эксперименты проводились на восьми реальных датасетах временных рядов. Модели WaveTS-B и WaveTS-M показали значительное превосходство по отношению к современным алгоритмам по метрикам RMSE и MAE. Например, WaveTS-M сократила ошибки на 15% по сравнению с лучшими аналогами на многоканальных датасетах. Благодаря использованию волетных преобразований и MoE-фреймворка, модели достигли SOTA-результатов с затратой меньшего числа параметров. Это демонстрирует их эффективность и производительность в реальных сценариях. ## Значимость Модели WaveTS могут применяться в различных областях, таких как прогнозирование продаж, мониторинг здоровья и управление энергосистемами. Их основные преимущества заключаются в высокой точности прогнозов, эффективности расчетов и легковесной архитектуре. Эти модели могут существенно сократить необходимые ресурсы для обработки больших объемов данных, что делает их привлекательными для реального времени и ресурсозатратных приложений. В будущем планируется расширить модели для работы с высокочасто

Abstract

The field of time series forecasting is rapidly advancing, with recent large-scale Transformers and lightweight Multilayer Perceptron (MLP) models showing strong predictive performance. However, conventional Transformer models are often hindered by their large number of parameters and their limited ability to capture non-stationary features in data through smoothing. Similarly, MLP models struggle to manage multi-channel dependencies effectively. To address these limitations, we propose a novel, lightweight time series prediction model, WaveTS-B. This model combines wavelet transforms with MLP to capture both periodic and non-stationary characteristics of data in the wavelet domain. Building on this foundation, we propose a channel clustering strategy that incorporates a Mixture of Experts (MoE) framework, utilizing a gating mechanism and expert network to handle multi-channel dependencies efficiently. We propose WaveTS-M, an advanced model tailored for multi-channel time series prediction. Empirical evaluation across eight real-world time series datasets demonstrates that our WaveTS series models achieve state-of-the-art (SOTA) performance with significantly fewer parameters. Notably, WaveTS-M shows substantial improvements on multi-channel datasets, highlighting its effectiveness.

Ссылки и действия