TimeCluster with PCA is Equivalent to Subspace Identification of Linear Dynamical Systems

2509.12895v1 cs.LG, cs.DS 2025-09-18
Авторы:

Christian L. Hines, Samuel Spillard, Daniel P. Martin

Резюме на русском

## Контекст Одна из основных задач в области визуального анализа многомерных потоков данных — открытие структуры в длинных многомерных временных рядах. Это особенно важно в таких областях, как прогнозирование, мониторинг и анализ динамических систем. Одним из вызовов является проектирование эффективных методов, позволяющих выделить низкомерные структуры в данных, чтобы упростить их интерпретирование и прогнозирование. Исследователи в этой области сталкиваются с проблемой выбора методов, которые обеспечивают не только гибкость, но и надежность в выявлении существующих низкомерных структур. Таким образом, направление развития новых методов, которые могут объединить эффективность и простоту, остается актуальным. ## Метод TimeCluster — это метод визуального анализа, который использует динамическое проецирование данных в низкомассовый пространственный вектор. Этот подход основывается на применении главных компонент (Principal Component Analysis, PCA) для уменьшения размерности в процессе работы. Метод работает с последовательностью многомерных временных рядов, проецируя их в низкомерное пространство с помощью PCA. Теория подсистемной идентификации, в свою очередь, основывается на формировании матрицы Ханкела из данных временного ряда и применению SVD. Оба подхода используют тензорные методы для выявления низкомерных структур в данных. На теоретическом уровне, TimeCluster и subspace identification различаются лишь способом формирования исходных матриц, но результаты этих методов интерпретируются в разных контекстах. ## Результаты В экспериментах, проведенных на синтетических и реальных временных рядах, было продемонстрировано, что результаты TimeCluster, полученные при использовании PCA, совпадают с теми, которые достигаются при использовании subspace identification. Это подтверждает, что TimeCluster эквивалентен классическому подходу к идентификации низкомерных подпространств в системах динамических систем. Эксперименты показали, что оба подхода дают одинаковые координаты кластеров и соответствующие низкомерные подпространства. Это позволяет использовать TimeCluster не только для визуализации, но и для прогнозирования и моделирования динамических систем. ## Значимость Замечание о эквивалентности TimeCluster и subspace identification открывает новые возможности для применения техники в различных областях. Например, результаты TimeCluster могут быть использованы не только для визуального анализа, но и для прогнозирования в системах динамических потоков данных. Благодаря этому, TimeCluster может использоваться в таких областях, как прогнозирование временных рядов, мониторинг систем динамического характера, а также в анализе корреляций в многомерных данных. Эта эквивалентность также может позво

Abstract

TimeCluster is a visual analytics technique for discovering structure in long multivariate time series by projecting overlapping windows of data into a low-dimensional space. We show that, when Principal Component Analysis (PCA) is chosen as the dimensionality reduction technique, this procedure is mathematically equivalent to classical linear subspace identification (block-Hankel matrix plus Singular Vector Decomposition (SVD)). In both approaches, the same low-dimensional linear subspace is extracted from the time series data. We first review the TimeCluster method and the theory of subspace system identification. Then we show that forming the sliding-window matrix of a time series yields a Hankel matrix, so applying PCA (via SVD) to this matrix recovers the same principal directions as subspace identification. Thus the cluster coordinates from TimeCluster coincide with the subspace identification methods. We present experiments on synthetic and real dynamical signals confirming that the two embeddings coincide. Finally, we explore and discuss future opportunities enabled by this equivalence, including forecasting from the identified state space, streaming/online extensions, incorporating and visualising external inputs and robust techniques for displaying underlying trends in corrupted data.

Ссылки и действия