Transparent and Fair Profiling in Employment Services: Evidence from Switzerland
2509.11847v1
cs.LG, cs.CY
2025-09-17
Авторы:
Tim Räz
Резюме на русском
## Контекст
Длительный безработицы (LTU) остается значительной проблемой для искателей работы и органов государственных служб по работодательству. Чтобы сузить пробелы в мотивации и квалификации, а также оптимизировать индивидуальные подходы, появились статистические инструменты профилирования. Однако некоторые из них, особенно те, которые основаны на непрозрачных машинным обучением, вызывают вопросы относительно их прозрачности и справедливости. Этот документ анализирует возможности замены таких моделей на более прозрачные, используя административные данные из Швейцарии. Он сравнивает традиционные статистические, прозрачные и "черные-ящик" модели, оценивая их прогностическую эффективность, транспарентность и справедливость.
## Метод
Для исследования были использованы административные данные об искателях работы и их работодателях. Методология включала сравнение трех типов моделей: традиционных статистических, прозрачных и непрозрачных. Традиционные модели основывались на линейных регрессиях, таких как логистическая регрессия. "Черные-ящик" модели использовали глубокое обучение, особенно градиентный бустинг (XGBoost). Новые модели "объясняемый бустинг" (Explainable Boosting Machines, EBM) представляют собой свежий подход, который стремится объединить транспарентность и высокую прогностическую эффективность. Методы функционировали на основе техники семплирования, линейных моделей и штрафов за несправедливость.
## Результаты
Результаты сравнения показали, что модель EBM почти равняется по прогностической эффективности лучшим "черным-ящиком" моделям, но обеспечивает гораздо большую транспарентность. Модель EBM может быть легко интерпретирована, что позволяет понять, как она приходит к определенным прогнозам. Эксперименты также показали, что модели могут быть улучшены с помощью техник, таких как уменьшение спарсиности модели, сглаживание признаков и устранение проблем справедливости. Такие улучшения приводят к незначительной потере в прогностической эффективности, но значительно повышают прозрачность и справедливость.
## Значимость
Прозрачные инструменты профилирования могут быть применены в различных сферах, в том числе в трудоустройстве, банковском сервисе и здравоохранении. Изучение моделей EBM показывает, что они могут быть инструментом, который обеспечивает доверие и аккаунтабельность, не уменьшая прогностическую эффективность. Это делает их привлекательными для органов государственного управления, которым требуется большая прозрачность и ответственность в принятии решений.
## Выводы
Abstract
Long-term unemployment (LTU) is a challenge for both jobseekers and public
employment services. Statistical profiling tools are increasingly used to
predict LTU risk. Some profiling tools are opaque, black-box machine learning
models, which raise issues of transparency and fairness. This paper
investigates whether interpretable models could serve as an alternative, using
administrative data from Switzerland. Traditional statistical, interpretable,
and black-box models are compared in terms of predictive performance,
interpretability, and fairness. It is shown that explainable boosting machines,
a recent interpretable model, perform nearly as well as the best black-box
models. It is also shown how model sparsity, feature smoothing, and fairness
mitigation can enhance transparency and fairness with only minor losses in
performance. These findings suggest that interpretable profiling provides an
accountable and trustworthy alternative to black-box models without
compromising performance.
Ссылки и действия
Дополнительные ресурсы: