Constrained Centroid Clustering: A Novel Approach for Compact and Structured Partitioning
2508.12758v1
cs.LG, stat.ML
2025-08-20
Авторы:
Sowmini Devi Veeramachaneni, Ramamurthy Garimella
Резюме на русском
#### Контекст
Классические методы кластеризации, такие как K-means и Gaussian Mixture Models (GMM), становятся неэффективными при работе с данными, требующими компактной и структурированной партиционировании. Эти методы не учитывают ограничения на распределение точек в кластерах, что приводит к выведению подробных доказательств или нежелательным распределению. В этом контексте возникает необходимость разработки методов, которые могут обеспечить компактность кластеров с приращением распределения точек внутри них. Целью данной работы является разработка такого метода, который бы стал стандартом в ситуациях, где необходима компактность кластеров с учетом распределения точек внутри них.
#### Метод
Предлагаемый Constrained Centroid Clustering (CCC) расширяет классические методы кластеризации, внеся ограничение на максимальное расстояние от центра кластера до самой удаленной точки. Данное ограничение внедряется с помощью Lagrangian-формулировки, что позволяет достичь закрытого решения с максимальной интерпретируемостью. Таким образом, CCC позволяет контролировать распространение кластеров, улучшая их компактность без потери структуры. Данная модель имеет значительные преимущества по сравнению с существующими методами, так как она обеспечивает более точное разделение данных, сохраняя их структуру.
#### Результаты
Проведенные эксперименты показали, что CCC эффективно выполняет задачи компактной кластеризации, особенно при работе с радиально симметричными данными, такими как данные с радиальным распределением и угловой симметрией. Эти эксперименты были проведены с использованием различных метрик: радиального распределения, секторального распределения и совокупной энтропии. На основе этих результатов было установлено, что CCC представляет собой более эффективный подход к кластеризации, чем методы, такие как K-means и GMM. Это обусловлено тем, что CCC обеспечивает более компактные кластеры, сохраняя распределение точек внутри них, что недостижимо при использовании исходных методов.
#### Значимость
Предлагаемый подход имеет широкое применение в ситуациях, где необходимо обеспечить компактность кластеров с учетом распределения точек внутри них. Например, CCC может быть применен в системах сенсорных сетей, коллаборативных роботах и анализе интерпретируемого паттерна. Основные преимущества CCC заключаются в том, что он обеспечивает более точное разделение данных и позволяет контролировать распределение точек внутри кластеров, что недостижимо при использовании классических методов. Это может иметь значительное влияние на развитие технологий, где необходимо надежное раз
Abstract
This paper presents Constrained Centroid Clustering (CCC), a method that
extends classical centroid-based clustering by enforcing a constraint on the
maximum distance between the cluster center and the farthest point in the
cluster. Using a Lagrangian formulation, we derive a closed-form solution that
maintains interpretability while controlling cluster spread. To evaluate CCC,
we conduct experiments on synthetic circular data with radial symmetry and
uniform angular distribution. Using ring-wise, sector-wise, and joint entropy
as evaluation metrics, we show that CCC achieves more compact clusters by
reducing radial spread while preserving angular structure, outperforming
standard methods such as K-means and GMM. The proposed approach is suitable for
applications requiring structured clustering with spread control, including
sensor networks, collaborative robotics, and interpretable pattern analysis.
Ссылки и действия
Дополнительные ресурсы: