Subspace Clustering of Subspaces: Unifying Canonical Correlation Analysis and Subspace Clustering
2509.18653v1
cs.LG, eess.SP
2025-09-25
Авторы:
Paris A. Karakasis, Nicholas D. Sidiropoulos
Резюме на русском
## Контекст
Одна из основных задач в области машинного обучения и анализа данных — кластеризация высокомерных данных. Традиционные методы кластеризации, такие как k-means или Gaussian Mixture Models (GMM), сталкиваются с трудностями при работе с высокоразмерными данными, такими как изображения, расположенные в пространстве высокого числа измерений. Эти методы требуют предварительного снижения размерности, что может привести к потере информации. Более новые подходы, такие как Subspace Clustering (SC), адресованы этому вопросу, используя структуру данных, организованную вокруг субспасей. Однако большинство методов SCoS предполагают, что данные представлены в виде векторов, что не является универсальным решением для всех задач. Наша исследовательская мотивация заключается в разработке более гибкого и универсального подхода к кластеризации субспасей, который может работать непосредственно с данными в высоком размерном пространстве.
## Метод
Мы предлагаем новый фреймворк для кластеризации субспасей, который мы называем Subspace Clustering of Subspaces (SCoS). В отличие от существующих методов, SCoS работает непосредственно с матрицами, где каждая строка представляет собой вектор в высоком размерном пространстве. Мы используем общую математическую модель, называемую Block Term Decomposition (BTD), для построения третьего-порядка тензора из входных матриц. Этот тензор позволяет одновременно оценивать участие каждой матрицы в кластере и то, какой фрагмент субспасса должен принадлежать определенному кластеру. Мы также устанавливаем теоретические результаты, показывающие, что наша модель может быть идентифицирована в условиях, которые традиционно были считаны недостаточными для классических подходов к кластеризации. Наша архитектура основывается на эффективных алгоритмах оптимизации, которые допускают масштабирование для больших наборов данных.
## Результаты
Мы проводили эксперименты с реальными данными, используя датасеты из области гиперспектрального иммунинга. Эти данные характеризуются высоким размерностным пространством и сильным шумом. Мы сравнили наш подход с несколькими существующими методами кластеризации субспасей. Результаты показали, что SCoS достигает высокой точности кластеризации и лучшего устойчивости к шуму в сравнении с другими методами. Эти результаты указывают на мощь нашего подхода в области высокомерных задач кластеризации, где существует структура, которая идентифицируется не только внутри отдельных векторов, но и в связях между ними.
## Значимость
Предлагаемый подход имеет широкие возможности для применения в сложных высокомерных задачах, таких как
Abstract
We introduce a novel framework for clustering a collection of tall matrices
based on their column spaces, a problem we term Subspace Clustering of
Subspaces (SCoS). Unlike traditional subspace clustering methods that assume
vectorized data, our formulation directly models each data sample as a matrix
and clusters them according to their underlying subspaces. We establish
conceptual links to Subspace Clustering and Generalized Canonical Correlation
Analysis (GCCA), and clarify key differences that arise in this more general
setting. Our approach is based on a Block Term Decomposition (BTD) of a
third-order tensor constructed from the input matrices, enabling joint
estimation of cluster memberships and partially shared subspaces. We provide
the first identifiability results for this formulation and propose scalable
optimization algorithms tailored to large datasets. Experiments on real-world
hyperspectral imaging datasets demonstrate that our method achieves superior
clustering accuracy and robustness, especially under high noise and
interference, compared to existing subspace clustering techniques. These
results highlight the potential of the proposed framework in challenging
high-dimensional applications where structure exists beyond individual data
vectors.
Ссылки и действия
Дополнительные ресурсы: