DP-GPT4MTS: Dual-Prompt Large Language Model for Textual-Numerical Time Series Forecasting

2508.04239v1 cs.CL 2025-08-09
Авторы:

Chanjuan Liu, Shengzhi Wang, Enqiang Zhu

Резюме на русском

Задача прогнозирования текстово-численных рядов временных рядов является ключевой для стратегического планирования и принятия решений во многих отраслях. Несмотря на то, что текущие модели LLMs (large language models) могут обрабатывать мультимодальные данные, они часто сталкиваются с проблемами эффективного интегрирования текстовых данных, включая текстовую контекстуальную информацию, такую как новости и события. Эти проблемы могут привести к неточности прогнозов и ненужной редупликации информации. Чтобы решить эти задачи, предлагается DP-GPT4MTS (Dual-Prompt Large Language Model for Multimodal Time Series) — модель, основанная на dual-prompt механизме. Она включает в себя оперативный инструктивный промод и контекстуальный промод на основе временных меток данных. Эксперименты по различным текстово-численным данным показали, что DP-GPT4MTS превосходит современные алгоритмы в точности прогнозирования, демонстрируя значимость интеграции текстовой контекстуальной информации с помощью двойных промов.

Abstract

Time series forecasting is crucial in strategic planning and decision-making across various industries. Traditional forecasting models mainly concentrate on numerical time series data, often overlooking important textual information such as events and news, which can significantly affect forecasting accuracy. While large language models offer a promise for integrating multimodal data, existing single-prompt frameworks struggle to effectively capture the semantics of timestamped text, introducing redundant information that can hinder model performance. To address this limitation, we introduce DP-GPT4MTS (Dual-Prompt GPT2-base for Multimodal Time Series), a novel dual-prompt large language model framework that combines two complementary prompts: an explicit prompt for clear task instructions and a textual prompt for context-aware embeddings from time-stamped data. The tokenizer generates the explicit prompt while the embeddings from the textual prompt are refined through self-attention and feed-forward networks. Comprehensive experiments conducted on diverse textural-numerical time series datasets demonstrate that this approach outperforms state-of-the-art algorithms in time series forecasting. This highlights the significance of incorporating textual context via a dual-prompt mechanism to achieve more accurate time series predictions.

Ссылки и действия