Transparent and Fair Profiling in Employment Services: Evidence from Switzerland

2509.11847v1 cs.LG, cs.CY 2025-09-17
Авторы:

Tim Räz

Резюме на русском

## Контекст Длительный безработицы (LTU) остается значительной проблемой для искателей работы и органов государственных служб по работодательству. Чтобы сузить пробелы в мотивации и квалификации, а также оптимизировать индивидуальные подходы, появились статистические инструменты профилирования. Однако некоторые из них, особенно те, которые основаны на непрозрачных машинным обучением, вызывают вопросы относительно их прозрачности и справедливости. Этот документ анализирует возможности замены таких моделей на более прозрачные, используя административные данные из Швейцарии. Он сравнивает традиционные статистические, прозрачные и "черные-ящик" модели, оценивая их прогностическую эффективность, транспарентность и справедливость. ## Метод Для исследования были использованы административные данные об искателях работы и их работодателях. Методология включала сравнение трех типов моделей: традиционных статистических, прозрачных и непрозрачных. Традиционные модели основывались на линейных регрессиях, таких как логистическая регрессия. "Черные-ящик" модели использовали глубокое обучение, особенно градиентный бустинг (XGBoost). Новые модели "объясняемый бустинг" (Explainable Boosting Machines, EBM) представляют собой свежий подход, который стремится объединить транспарентность и высокую прогностическую эффективность. Методы функционировали на основе техники семплирования, линейных моделей и штрафов за несправедливость. ## Результаты Результаты сравнения показали, что модель EBM почти равняется по прогностической эффективности лучшим "черным-ящиком" моделям, но обеспечивает гораздо большую транспарентность. Модель EBM может быть легко интерпретирована, что позволяет понять, как она приходит к определенным прогнозам. Эксперименты также показали, что модели могут быть улучшены с помощью техник, таких как уменьшение спарсиности модели, сглаживание признаков и устранение проблем справедливости. Такие улучшения приводят к незначительной потере в прогностической эффективности, но значительно повышают прозрачность и справедливость. ## Значимость Прозрачные инструменты профилирования могут быть применены в различных сферах, в том числе в трудоустройстве, банковском сервисе и здравоохранении. Изучение моделей EBM показывает, что они могут быть инструментом, который обеспечивает доверие и аккаунтабельность, не уменьшая прогностическую эффективность. Это делает их привлекательными для органов государственного управления, которым требуется большая прозрачность и ответственность в принятии решений. ## Выводы

Abstract

Long-term unemployment (LTU) is a challenge for both jobseekers and public employment services. Statistical profiling tools are increasingly used to predict LTU risk. Some profiling tools are opaque, black-box machine learning models, which raise issues of transparency and fairness. This paper investigates whether interpretable models could serve as an alternative, using administrative data from Switzerland. Traditional statistical, interpretable, and black-box models are compared in terms of predictive performance, interpretability, and fairness. It is shown that explainable boosting machines, a recent interpretable model, perform nearly as well as the best black-box models. It is also shown how model sparsity, feature smoothing, and fairness mitigation can enhance transparency and fairness with only minor losses in performance. These findings suggest that interpretable profiling provides an accountable and trustworthy alternative to black-box models without compromising performance.

Ссылки и действия