Robust Mixture Models for Algorithmic Fairness Under Latent Heterogeneity

2509.17411v1 stat.ML, cs.LG 2025-09-24

Авторы:

Siqi Li, Molei Liu, Ziye Tian, Chuan Hong, Nan Liu

Резюме на русском

## Контекст В машинном обучении стандартные модели, оптимизированные для общей производительности, часто сталкиваются с проблемами на менее выраженных подгруппах данных. Эти проблемы усиливаются при наличии скрытых подгрупп, которые могут быть влияны сложными взаимодействиями между линейными и дискретными признаками. Эти особенности становятся критически важными в таких областях, как рекрутинг, заемный сервис и здравоохранение, где необходимо минимизировать алгоритмическую несправедливость и обеспечить высокую производительность в условиях неопределенности подгрупп. Рост технологий, включая нейронные сети, дал улучшенную точность, но привел к ухудшению честности и устойчивости моделей. Многие методы, пытающиеся улучшить честность, требуют дополнительных меток подгрупп, что неэффективно в реальных ситуациях, где такие метки могут быть недоступны или сложно определить. Мы предлагаем ROME (RObust Mixture Ensemble), метод, который может обнаруживать скрытую структуру подгрупп и оптимизироваться для худшей подгруппы, улучшая честность и устойчивость без дополнительных меток подгрупп. ## Метод ROME предлагает две основные концепции: линейный ROME, основанный на алгоритме Эмпирического Максимума (EM) для моделей линейных моделей, и нейронный ROME, основанный на Миксетов-Экспертов для нелинейных сетей. Линейный ROME использует EM для выявления скрытого структурного подкласса, а нейронный ROME расширяет эту идею с использованием нейронных сетей, включая несколько экспертов, чтобы учитывать сложные взаимосвязи в данных. Оба подхода ориентированы на максимизацию функции потерь для худшей подгруппы, чтобы повысить уязвимость модели к низким результатам для самых жертвенных подгрупп. Модель обучается используя данные без дополнительных меток подгрупп, что делает ее работоспособной даже в условиях неопределенности подгрупп. ## Результаты Мы проверили ROME на наборах данных, включая COMPAS, Adult и CelebA, сравнив с такими методами, как re-weighting и Group DRO. Наши результаты показали, что ROME превосходит эти методы в тестах на худшую подгруппу, сохраняя высокую производительность на общей выборке. Мы также провели эксперименты с нелинейными моделями на нескольких многозначных данных, показав, что Микстов-Экспертов обеспечивают значительные улучшения в честности в сравнении с линейными моделями. Эти результаты подтверждают гибкость и эффективность ROME в различных сценариях. ## Значимость ROME может применяться в тех областях, где необходимо улучшение честности моделей в условиях неопределенности подгрупп, таких как рекрутин

Abstract

Standard machine learning models optimized for average performance often fail on minority subgroups and lack robustness to distribution shifts. This challenge worsens when subgroups are latent and affected by complex interactions among continuous and discrete features. We introduce ROME (RObust Mixture Ensemble), a framework that learns latent group structure from data while optimizing for worst-group performance. ROME employs two approaches: an Expectation-Maximization algorithm for linear models and a neural Mixture-of-Experts for nonlinear settings. Through simulations and experiments on real-world datasets, we demonstrate that ROME significantly improves algorithmic fairness compared to standard methods while maintaining competitive average performance. Importantly, our method requires no predefined group labels, making it practical when sources of disparities are unknown or evolving.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Robust Mixture Models for Algorithmic Fairness Under Latent Heterogeneity

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Consequences of Kernel Regularity for Bandit Optimization

Comparison of neural network training strategies for the simulation of dynamical...

Informative missingness and its implications in semi-supervised learning

Recurrent Neural Networks with Linear Structures for Electricity Price Forecasti...

Control Consistency Losses for Diffusion Bridges

Навигация