Welfare-Centric Clustering

2508.10345v1 cs.LG, cs.AI, cs.CY, cs.DS 2025-08-16
Авторы:

Claire Jie Zhang, Seyed A. Esmaeili, Jamie Morgenstern

Резюме на русском

## Контекст Fair clustering, традиционно, стремился обеспечить справедливое представление групп или равномерную распределенность групп по кластерам. Однако Dickerson et al. (2025) показали, что эти подходы могут привести к нежелательным и неожиданным результатам. В отличие от них, программы welfare-centric clustering моделируют групповые удовлетворенности на основе расстояний и пропорционального представления. Эта мотивация исходит от необходимости создания методов, которые бы учитывали не только расстояния, но и целевые ценности для групп. Наша работа призвана развить эти идеи, предлагая новые алгоритмы и теоретические гарантии по формализации и решению проблем справедливого кластеризации. ## Метод Мы предлагаем новые модели для welfare-centric clustering, основанные на двух оптимизационных целях: Rawlsian (Egalitarian) и Utilitarian. Методы основываются на произвольной геометрии кластеров, что дает гибкость в учете различных аспектов в формировании кластеров. Для обоих целей мы предлагаем алгоритмы с оптимальными или приближенными решениями, включающими графовые алгоритмы и линейное программирование. Эти алгоритмы развиваются в рамках общей архитектуры, которая обеспечивает сбалансированное учете динамических и статических факторов. ## Результаты Мы проводили эксперименты на нескольких реальных датасетах, включая те, которые использовались в предыдущих работах по справедливому кластеризации. Методы, основанные на welfare-centric clustering, показали существенную выгоду по сравнению с базовыми подходами. В частности, один из алгоритмов предложенных нами показал лучшие результаты в терминах пропорционального представления и равномерности распределения. Эти результаты были подтверждены теоретическими гарантиями и высокой точностью в реальных условиях. ## Значимость Welfare-centric clustering может быть применен в различных областях, таких как распределение ресурсов, моделирование социальных сетей или принятие решений в сфере здравоохранения. Наш подход предлагает более гибкие и справедливые способы анализа и кластеризации данных, учитывая конкретные цели и удовлетворенность групп. Это может привести к оценкам, которые лучше отражают реальные ценности и необходимости в реальном мире. Это имеет потенциал для изменения того, как мы принимаем решения в сферах, где групповые заинтересованности имеют большое значение. ## Выводы Наша работа демонстрирует, что welfare-centric clustering может предложить новый подход к справедливому кластеризации, основываясь на моделировании групповых удовлетворенностей. Мы продвигаем теоретические гарантии и эффективные алгоритмы, которые позволяют о

Abstract

Fair clustering has traditionally focused on ensuring equitable group representation or equalizing group-specific clustering costs. However, Dickerson et al. (2025) recently showed that these fairness notions may yield undesirable or unintuitive clustering outcomes and advocated for a welfare-centric clustering approach that models the utilities of the groups. In this work, we model group utilities based on both distances and proportional representation and formalize two optimization objectives based on welfare-centric clustering: the Rawlsian (Egalitarian) objective and the Utilitarian objective. We introduce novel algorithms for both objectives and prove theoretical guarantees for them. Empirical evaluations on multiple real-world datasets demonstrate that our methods significantly outperform existing fair clustering baselines.

Ссылки и действия