Parameter-free entropy-regularized multi-view clustering with hierarchical feature selection
2508.05504v1
cs.LG, cs.CV, math.ST, stat.TH, 62H30, 68T05, 68T09, 62H25, 94A17
2025-08-09
Авторы:
Kristina P. Sinaga, Sara Colantonio, Miin-Shen Yang
Резюме на русском
Усовершенствование методов многовидного кластеризации является актуальной задачей в области машинного обучения, особенно при работе с высокомерновыми и зашумленными данными. В статье предлагается новый подход к решению этой проблемы, основанный на алгоритмах AMVFCM-U и AAMVFCM-U. Они отличаются тем, что заменяют традиционные параметры на регуляризационные элементы, основанные на сигнал-шум и энтропии. Это позволяет адаптивно консенсусы между представлениями и эффективно сжимать пространство признаков. Была представлена расширенная версия AAMVFCM-U, включающая в себя встроенную горизонтальную дименициональность с использованием трешхолдинга. Эксперименты показали, что предложенные методы достигли прироста вычислительной эффективности до 97%, снизили размер признакового пространства до 0.45% от исходного, а также автоматически выделили критические комбинации представлений, улучшив итоговый результат кластеризации в сравнении с 15 современными методами.
Abstract
Multi-view clustering faces critical challenges in automatically discovering
patterns across heterogeneous data while managing high-dimensional features and
eliminating irrelevant information. Traditional approaches suffer from manual
parameter tuning and lack principled cross-view integration mechanisms. This
work introduces two complementary algorithms: AMVFCM-U and AAMVFCM-U, providing
a unified parameter-free framework. Our approach replaces fuzzification
parameters with entropy regularization terms that enforce adaptive cross-view
consensus. The core innovation employs signal-to-noise ratio based
regularization ($\delta_j^h = \frac{\bar{x}_j^h}{(\sigma_j^h)^2}$) for
principled feature weighting with convergence guarantees, coupled with
dual-level entropy terms that automatically balance view and feature
contributions. AAMVFCM-U extends this with hierarchical dimensionality
reduction operating at feature and view levels through adaptive thresholding
($\theta^{h^{(t)}} = \frac{d_h^{(t)}}{n}$). Evaluation across five diverse
benchmarks demonstrates superiority over 15 state-of-the-art methods. AAMVFCM-U
achieves up to 97% computational efficiency gains, reduces dimensionality to
0.45% of original size, and automatically identifies critical view combinations
for optimal pattern discovery.