Parameter-free entropy-regularized multi-view clustering with hierarchical feature selection

2508.05504v1 cs.LG, cs.CV, math.ST, stat.TH, 62H30, 68T05, 68T09, 62H25, 94A17 2025-08-09
Авторы:

Kristina P. Sinaga, Sara Colantonio, Miin-Shen Yang

Резюме на русском

Усовершенствование методов многовидного кластеризации является актуальной задачей в области машинного обучения, особенно при работе с высокомерновыми и зашумленными данными. В статье предлагается новый подход к решению этой проблемы, основанный на алгоритмах AMVFCM-U и AAMVFCM-U. Они отличаются тем, что заменяют традиционные параметры на регуляризационные элементы, основанные на сигнал-шум и энтропии. Это позволяет адаптивно консенсусы между представлениями и эффективно сжимать пространство признаков. Была представлена расширенная версия AAMVFCM-U, включающая в себя встроенную горизонтальную дименициональность с использованием трешхолдинга. Эксперименты показали, что предложенные методы достигли прироста вычислительной эффективности до 97%, снизили размер признакового пространства до 0.45% от исходного, а также автоматически выделили критические комбинации представлений, улучшив итоговый результат кластеризации в сравнении с 15 современными методами.

Abstract

Multi-view clustering faces critical challenges in automatically discovering patterns across heterogeneous data while managing high-dimensional features and eliminating irrelevant information. Traditional approaches suffer from manual parameter tuning and lack principled cross-view integration mechanisms. This work introduces two complementary algorithms: AMVFCM-U and AAMVFCM-U, providing a unified parameter-free framework. Our approach replaces fuzzification parameters with entropy regularization terms that enforce adaptive cross-view consensus. The core innovation employs signal-to-noise ratio based regularization ($\delta_j^h = \frac{\bar{x}_j^h}{(\sigma_j^h)^2}$) for principled feature weighting with convergence guarantees, coupled with dual-level entropy terms that automatically balance view and feature contributions. AAMVFCM-U extends this with hierarchical dimensionality reduction operating at feature and view levels through adaptive thresholding ($\theta^{h^{(t)}} = \frac{d_h^{(t)}}{n}$). Evaluation across five diverse benchmarks demonstrates superiority over 15 state-of-the-art methods. AAMVFCM-U achieves up to 97% computational efficiency gains, reduces dimensionality to 0.45% of original size, and automatically identifies critical view combinations for optimal pattern discovery.

Ссылки и действия