TimeMKG: Knowledge-Infused Causal Reasoning for Multivariate Time Series Modeling
2508.09630v2
cs.LG, cs.AI
2025-08-18
Авторы:
Yifei Sun, Junming Liu, Yirong Chen, Xuefeng Yan, Ding Wang
Резюме на русском
## Контекст
В настоящее время анализ временных рядов представляет собой ключевую область исследований, особенно в рамках обработки данных, связанных с МТС (многомерные временные ряды). Традиционные модели временных рядов, такие как ARIMA и другие статистические модели, хотя и эффективны в моделировании тенденций и циклов, часто игнорируют семантическую информацию, которая заложена в названиях переменных и описательных текстах. Эти тексты, хотя могут казаться достаточно простыми, содержат ценную информацию, особенно в области науки, техники и бизнеса. Недостаток в использовании такой информации приводит к недооценке значимости информации, что в свою очередь сказывается на точности и интерпретируемости результатов моделирования. Таким образом, введение текстовой информации в моделирование временных рядов может значительно улучшить качество отклика и понимание результатов.
## Метод
TimeMKG — это многомодальный фреймворк, который включает в себя моделирование знаний и рассуждений по причинно-следственным соотношениям в области временных рядов. Он использует большие языковые модели (LLM) для выделения семантического контекста из названий переменных и других текстовых описаний. Для построения Multivariate Knowledge Graph (MKG), который представляет собой структурированный визуальный подход к описанию взаимосвязей между переменными, TimeMKG применяет процедуры семантического анализа и связывания знаний. Эта структура позволяет выделить взаимосвязи между переменными, чтобы понять влияние одной переменной на другую. Фреймворк также включает в себя двухмодальный кодировщик, который моделирует индивидуальные характеристики как семантические вызовы, так и статистические характеристики. Cross-modality attention функция используется для синхронизации и объединения этих двух моделей, что позволяет формировать целостное представление временных рядов.
## Результаты
В ходе экспериментов, проведенных в рамках TimeMKG, были использованы ряд данных из различных сфер, включая медицину, финансы и промышленность. Эти данные были обработаны с использованием TimeMKG в качестве модели, а результаты были сравнены с другими топовыми моделями, такими как LSTMs и Transformer-based модели. Обнаружено, что TimeMKG демонстрирует значительное улучшение в прогнозировании, а также позволяет добиться более высокой точности и интерпретируемости результатов. Результаты показывают, что интеграция знаний на уровне переменных способствует лучшей понимаемости результатов и способствует более точному моделированию временных рядов.
## Значимость
TimeMKG широко может быть применен в различных областях, таких как прогноз
Abstract
Multivariate time series data typically comprises two distinct modalities:
variable semantics and sampled numerical observations. Traditional time series
models treat variables as anonymous statistical signals, overlooking the rich
semantic information embedded in variable names and data descriptions. However,
these textual descriptors often encode critical domain knowledge that is
essential for robust and interpretable modeling. Here we present TimeMKG, a
multimodal causal reasoning framework that elevates time series modeling from
low-level signal processing to knowledge informed inference. TimeMKG employs
large language models to interpret variable semantics and constructs structured
Multivariate Knowledge Graphs that capture inter-variable relationships. A
dual-modality encoder separately models the semantic prompts, generated from
knowledge graph triplets, and the statistical patterns from historical time
series. Cross-modality attention aligns and fuses these representations at the
variable level, injecting causal priors into downstream tasks such as
forecasting and classification, providing explicit and interpretable priors to
guide model reasoning. The experiment in diverse datasets demonstrates that
incorporating variable-level knowledge significantly improves both predictive
performance and generalization.
Ссылки и действия
Дополнительные ресурсы: