Constrained Centroid Clustering: A Novel Approach for Compact and Structured Partitioning

2508.12758v1 cs.LG, stat.ML 2025-08-20
Авторы:

Sowmini Devi Veeramachaneni, Ramamurthy Garimella

Резюме на русском

#### Контекст Классические методы кластеризации, такие как K-means и Gaussian Mixture Models (GMM), становятся неэффективными при работе с данными, требующими компактной и структурированной партиционировании. Эти методы не учитывают ограничения на распределение точек в кластерах, что приводит к выведению подробных доказательств или нежелательным распределению. В этом контексте возникает необходимость разработки методов, которые могут обеспечить компактность кластеров с приращением распределения точек внутри них. Целью данной работы является разработка такого метода, который бы стал стандартом в ситуациях, где необходима компактность кластеров с учетом распределения точек внутри них. #### Метод Предлагаемый Constrained Centroid Clustering (CCC) расширяет классические методы кластеризации, внеся ограничение на максимальное расстояние от центра кластера до самой удаленной точки. Данное ограничение внедряется с помощью Lagrangian-формулировки, что позволяет достичь закрытого решения с максимальной интерпретируемостью. Таким образом, CCC позволяет контролировать распространение кластеров, улучшая их компактность без потери структуры. Данная модель имеет значительные преимущества по сравнению с существующими методами, так как она обеспечивает более точное разделение данных, сохраняя их структуру. #### Результаты Проведенные эксперименты показали, что CCC эффективно выполняет задачи компактной кластеризации, особенно при работе с радиально симметричными данными, такими как данные с радиальным распределением и угловой симметрией. Эти эксперименты были проведены с использованием различных метрик: радиального распределения, секторального распределения и совокупной энтропии. На основе этих результатов было установлено, что CCC представляет собой более эффективный подход к кластеризации, чем методы, такие как K-means и GMM. Это обусловлено тем, что CCC обеспечивает более компактные кластеры, сохраняя распределение точек внутри них, что недостижимо при использовании исходных методов. #### Значимость Предлагаемый подход имеет широкое применение в ситуациях, где необходимо обеспечить компактность кластеров с учетом распределения точек внутри них. Например, CCC может быть применен в системах сенсорных сетей, коллаборативных роботах и анализе интерпретируемого паттерна. Основные преимущества CCC заключаются в том, что он обеспечивает более точное разделение данных и позволяет контролировать распределение точек внутри кластеров, что недостижимо при использовании классических методов. Это может иметь значительное влияние на развитие технологий, где необходимо надежное раз

Abstract

This paper presents Constrained Centroid Clustering (CCC), a method that extends classical centroid-based clustering by enforcing a constraint on the maximum distance between the cluster center and the farthest point in the cluster. Using a Lagrangian formulation, we derive a closed-form solution that maintains interpretability while controlling cluster spread. To evaluate CCC, we conduct experiments on synthetic circular data with radial symmetry and uniform angular distribution. Using ring-wise, sector-wise, and joint entropy as evaluation metrics, we show that CCC achieves more compact clusters by reducing radial spread while preserving angular structure, outperforming standard methods such as K-means and GMM. The proposed approach is suitable for applications requiring structured clustering with spread control, including sensor networks, collaborative robotics, and interpretable pattern analysis.

Ссылки и действия