Robust Mixture Models for Algorithmic Fairness Under Latent Heterogeneity
2509.17411v1
stat.ML, cs.LG
2025-09-24
Авторы:
Siqi Li, Molei Liu, Ziye Tian, Chuan Hong, Nan Liu
Резюме на русском
## Контекст
В машинном обучении стандартные модели, оптимизированные для общей производительности, часто сталкиваются с проблемами на менее выраженных подгруппах данных. Эти проблемы усиливаются при наличии скрытых подгрупп, которые могут быть влияны сложными взаимодействиями между линейными и дискретными признаками. Эти особенности становятся критически важными в таких областях, как рекрутинг, заемный сервис и здравоохранение, где необходимо минимизировать алгоритмическую несправедливость и обеспечить высокую производительность в условиях неопределенности подгрупп. Рост технологий, включая нейронные сети, дал улучшенную точность, но привел к ухудшению честности и устойчивости моделей. Многие методы, пытающиеся улучшить честность, требуют дополнительных меток подгрупп, что неэффективно в реальных ситуациях, где такие метки могут быть недоступны или сложно определить. Мы предлагаем ROME (RObust Mixture Ensemble), метод, который может обнаруживать скрытую структуру подгрупп и оптимизироваться для худшей подгруппы, улучшая честность и устойчивость без дополнительных меток подгрупп.
## Метод
ROME предлагает две основные концепции: линейный ROME, основанный на алгоритме Эмпирического Максимума (EM) для моделей линейных моделей, и нейронный ROME, основанный на Миксетов-Экспертов для нелинейных сетей. Линейный ROME использует EM для выявления скрытого структурного подкласса, а нейронный ROME расширяет эту идею с использованием нейронных сетей, включая несколько экспертов, чтобы учитывать сложные взаимосвязи в данных. Оба подхода ориентированы на максимизацию функции потерь для худшей подгруппы, чтобы повысить уязвимость модели к низким результатам для самых жертвенных подгрупп. Модель обучается используя данные без дополнительных меток подгрупп, что делает ее работоспособной даже в условиях неопределенности подгрупп.
## Результаты
Мы проверили ROME на наборах данных, включая COMPAS, Adult и CelebA, сравнив с такими методами, как re-weighting и Group DRO. Наши результаты показали, что ROME превосходит эти методы в тестах на худшую подгруппу, сохраняя высокую производительность на общей выборке. Мы также провели эксперименты с нелинейными моделями на нескольких многозначных данных, показав, что Микстов-Экспертов обеспечивают значительные улучшения в честности в сравнении с линейными моделями. Эти результаты подтверждают гибкость и эффективность ROME в различных сценариях.
## Значимость
ROME может применяться в тех областях, где необходимо улучшение честности моделей в условиях неопределенности подгрупп, таких как рекрутин
Abstract
Standard machine learning models optimized for average performance often fail
on minority subgroups and lack robustness to distribution shifts. This
challenge worsens when subgroups are latent and affected by complex
interactions among continuous and discrete features. We introduce ROME (RObust
Mixture Ensemble), a framework that learns latent group structure from data
while optimizing for worst-group performance. ROME employs two approaches: an
Expectation-Maximization algorithm for linear models and a neural
Mixture-of-Experts for nonlinear settings. Through simulations and experiments
on real-world datasets, we demonstrate that ROME significantly improves
algorithmic fairness compared to standard methods while maintaining competitive
average performance. Importantly, our method requires no predefined group
labels, making it practical when sources of disparities are unknown or
evolving.
Ссылки и действия
Дополнительные ресурсы: