DP-GPT4MTS: Dual-Prompt Large Language Model for Textual-Numerical Time Series Forecasting
2508.04239v1
cs.CL
2025-08-09
Авторы:
Chanjuan Liu, Shengzhi Wang, Enqiang Zhu
Резюме на русском
Задача прогнозирования текстово-численных рядов временных рядов является ключевой для стратегического планирования и принятия решений во многих отраслях. Несмотря на то, что текущие модели LLMs (large language models) могут обрабатывать мультимодальные данные, они часто сталкиваются с проблемами эффективного интегрирования текстовых данных, включая текстовую контекстуальную информацию, такую как новости и события. Эти проблемы могут привести к неточности прогнозов и ненужной редупликации информации. Чтобы решить эти задачи, предлагается DP-GPT4MTS (Dual-Prompt Large Language Model for Multimodal Time Series) — модель, основанная на dual-prompt механизме. Она включает в себя оперативный инструктивный промод и контекстуальный промод на основе временных меток данных. Эксперименты по различным текстово-численным данным показали, что DP-GPT4MTS превосходит современные алгоритмы в точности прогнозирования, демонстрируя значимость интеграции текстовой контекстуальной информации с помощью двойных промов.
Abstract
Time series forecasting is crucial in strategic planning and decision-making
across various industries. Traditional forecasting models mainly concentrate on
numerical time series data, often overlooking important textual information
such as events and news, which can significantly affect forecasting accuracy.
While large language models offer a promise for integrating multimodal data,
existing single-prompt frameworks struggle to effectively capture the semantics
of timestamped text, introducing redundant information that can hinder model
performance. To address this limitation, we introduce DP-GPT4MTS (Dual-Prompt
GPT2-base for Multimodal Time Series), a novel dual-prompt large language model
framework that combines two complementary prompts: an explicit prompt for clear
task instructions and a textual prompt for context-aware embeddings from
time-stamped data. The tokenizer generates the explicit prompt while the
embeddings from the textual prompt are refined through self-attention and
feed-forward networks. Comprehensive experiments conducted on diverse
textural-numerical time series datasets demonstrate that this approach
outperforms state-of-the-art algorithms in time series forecasting. This
highlights the significance of incorporating textual context via a dual-prompt
mechanism to achieve more accurate time series predictions.
Ссылки и действия
Дополнительные ресурсы: