Fairness for the People, by the People: Minority Collective Action

2508.15374v1 cs.LG, cs.CY 2025-08-23
Авторы:

Omri Ben-Dov, Samira Samadi, Amartya Sanyal, Alexandru Ţifrea

Резюме на русском

## Контекст В современном мире машинного обучения становится все более важной частью жизни, приложения и систем. Однако многие модели могут сохранять биасы, присутствующие в тренировочных данных, что приводит к несправедливости в трактовке данных, особенно для меньшинств. Это проблема возникает из-за того, что традиционные методы снижения биаса часто требуют затрат на ресурсы и поддержки от организаций. Более того, такие методы могут привести к потерям в эффективности модели. Здесь мы рассматриваем рамку **Algorithmic Collective Action (ACA)**, в рамках которой группы пользователей могут самостоятельно работать над улучшением справедливости моделей, используя свои собственные данные. Это подход может устранять необходимость в постоянной организации и взаимодействии с организациями, чтобы добиться справедливости. ## Метод Мы предлагаем модель алгоритмического самоорганизованного действия, ориентированную на снижение несправедливости в моделях машинного обучения, используя данные, предоставленные пользователями. Методы основываются на **collective label relabeling**, где пользователи используют свои данные для повышения справедливости. Мы предлагаем три модели, которые представляют собой методы **relabeling**, которые могут быть урезаны до минимального количества данных и могут быть работать с любыми моделями машинного обучения. Данные были сгруппированы по уровням доверия, чтобы обеспечить эффективное использование данных. ## Результаты Мы проводили эксперименты с данными, собранными с разных источников, в том числе **Census Income Dataset**, и проверяли эффективность данных методов. Наши результаты показывают, что даже небольшие группы пользователей, работающие совместно, могут существенно снизить несправедливость в моделей, не влияя на общую точность модели. Мы также показали, что наш подход может быть использован в различных типах данных и моделях. Это значит, что это может быть применено в различных областях, как в социальных сетях, так и в здравоохранении. ## Значимость Наш подход может быть применен в многих областях, где существуют проблемы с несправедливостью в моделях машинного обучения. Это может быть полезно в **здравоохранении**, **рекламных системах**, **финансовых моделях** и других сферах. Особым преимуществом является то, что пользователи могут значительно снизить несправедливость, не требуя организационного вмешательства. Это может привести к **более справедливым решениям** в различных системах, где существуют проблемы с биасами. ## Выводы Мы показали, что наш подход **Algorithmic Collective Action** может быть мощным инструментом для создания более справедливых моде

Abstract

Machine learning models often preserve biases present in training data, leading to unfair treatment of certain minority groups. Despite an array of existing firm-side bias mitigation techniques, they typically incur utility costs and require organizational buy-in. Recognizing that many models rely on user-contributed data, end-users can induce fairness through the framework of Algorithmic Collective Action, where a coordinated minority group strategically relabels its own data to enhance fairness, without altering the firm's training process. We propose three practical, model-agnostic methods to approximate ideal relabeling and validate them on real-world datasets. Our findings show that a subgroup of the minority can substantially reduce unfairness with a small impact on the overall prediction error.

Ссылки и действия