TimeMKG: Knowledge-Infused Causal Reasoning for Multivariate Time Series Modeling

2508.09630v2 cs.LG, cs.AI 2025-08-18

Авторы:

Yifei Sun, Junming Liu, Yirong Chen, Xuefeng Yan, Ding Wang

Резюме на русском

## Контекст В настоящее время анализ временных рядов представляет собой ключевую область исследований, особенно в рамках обработки данных, связанных с МТС (многомерные временные ряды). Традиционные модели временных рядов, такие как ARIMA и другие статистические модели, хотя и эффективны в моделировании тенденций и циклов, часто игнорируют семантическую информацию, которая заложена в названиях переменных и описательных текстах. Эти тексты, хотя могут казаться достаточно простыми, содержат ценную информацию, особенно в области науки, техники и бизнеса. Недостаток в использовании такой информации приводит к недооценке значимости информации, что в свою очередь сказывается на точности и интерпретируемости результатов моделирования. Таким образом, введение текстовой информации в моделирование временных рядов может значительно улучшить качество отклика и понимание результатов. ## Метод TimeMKG — это многомодальный фреймворк, который включает в себя моделирование знаний и рассуждений по причинно-следственным соотношениям в области временных рядов. Он использует большие языковые модели (LLM) для выделения семантического контекста из названий переменных и других текстовых описаний. Для построения Multivariate Knowledge Graph (MKG), который представляет собой структурированный визуальный подход к описанию взаимосвязей между переменными, TimeMKG применяет процедуры семантического анализа и связывания знаний. Эта структура позволяет выделить взаимосвязи между переменными, чтобы понять влияние одной переменной на другую. Фреймворк также включает в себя двухмодальный кодировщик, который моделирует индивидуальные характеристики как семантические вызовы, так и статистические характеристики. Cross-modality attention функция используется для синхронизации и объединения этих двух моделей, что позволяет формировать целостное представление временных рядов. ## Результаты В ходе экспериментов, проведенных в рамках TimeMKG, были использованы ряд данных из различных сфер, включая медицину, финансы и промышленность. Эти данные были обработаны с использованием TimeMKG в качестве модели, а результаты были сравнены с другими топовыми моделями, такими как LSTMs и Transformer-based модели. Обнаружено, что TimeMKG демонстрирует значительное улучшение в прогнозировании, а также позволяет добиться более высокой точности и интерпретируемости результатов. Результаты показывают, что интеграция знаний на уровне переменных способствует лучшей понимаемости результатов и способствует более точному моделированию временных рядов. ## Значимость TimeMKG широко может быть применен в различных областях, таких как прогноз

Abstract

Multivariate time series data typically comprises two distinct modalities: variable semantics and sampled numerical observations. Traditional time series models treat variables as anonymous statistical signals, overlooking the rich semantic information embedded in variable names and data descriptions. However, these textual descriptors often encode critical domain knowledge that is essential for robust and interpretable modeling. Here we present TimeMKG, a multimodal causal reasoning framework that elevates time series modeling from low-level signal processing to knowledge informed inference. TimeMKG employs large language models to interpret variable semantics and constructs structured Multivariate Knowledge Graphs that capture inter-variable relationships. A dual-modality encoder separately models the semantic prompts, generated from knowledge graph triplets, and the statistical patterns from historical time series. Cross-modality attention aligns and fuses these representations at the variable level, injecting causal priors into downstream tasks such as forecasting and classification, providing explicit and interpretable priors to guide model reasoning. The experiment in diverse datasets demonstrates that incorporating variable-level knowledge significantly improves both predictive performance and generalization.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

TimeMKG: Knowledge-Infused Causal Reasoning for Multivariate Time Series Modeling

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Prototype-Based Semantic Consistency Alignment for Domain Adaptive Retrieval

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

TimesNet-Gen: Deep Learning-based Site Specific Strong Motion Generation

Realizable Abstractions: Near-Optimal Hierarchical Reinforcement Learning

BEP: A Binary Error Propagation Algorithm for Binary Neural Networks Training

Навигация