A Human-In-The-Loop Approach for Improving Fairness in Predictive Business Process Monitoring

2508.17477v1 cs.LG, cs.CY, 68T07, 68T01, 68U35 2025-08-27
Авторы:

Martin Käppel, Julian Neuberger, Felix Möhrlein, Sven Weinzierl, Martin Matzner, Stefan Jablonski

Резюме на русском

## Контекст Предвидение бизнес-процессов (predictive process monitoring) позволяет организациям прогнозировать поток действий в процессах на ранней стадии их выполнения. Это позволяет проводить проактивные действия и корректировки. Используя мощные машинное обучение, такие модели достигли впечатляющих результатов в прогнозировании итогов, следующих действий и оставшихся временных интервалов. Однако, данные-ориентированная природа этих моделей делает их чувствительными к наличию несправедливости и мотивированной дискриминации в данных. Такие модели могут использоваться с учетом законов и морали, но могут также включать в себя несправедливые решения, основываясь на таких атрибутах, как пол или возраст участников процесса. Многие работы старались устранять эти проблемы, но часто подходы включают в себя лишение моделей от анализа таких атрибутов, что может привести к потере важной информации. Наша работа сосредотачивается на поиске баланса между правильным использованием и устранением несправедливости в моделях. ## Метод Мы предлагаем модель-агностичный подход, основанный на интерактивной интерпретации, который может работать со существующими моделями бизнес-процессов. Мы используем закодированный декістром деревом модели, которое позволяет извлекать простые правила, которые регулируют решение. Наш подход работает с участием человека, который может руководствовать процесс правильной интерпретации. Мы используем технологии, которые позволяют отличать безопасные, справедливые решения от небезопасных, дискриминационных. Метод может вести регулирование как на уровне модели, так и на уровне конкретных действий. Благодаря этому, наш подход может проверить и урегулировать дискриминацию в бизнес-процессах без полной исключения существенных атрибутов. ## Результаты Мы провели эксперименты на реальных данных, использовав три разных бизнес-процесса. Мы показали, что наш подход может улучшить справедливость решений в ситуациях, где потеря данных может привести к несправедливым решениям. Использовав человека в цикле (human-in-the-loop), мы провели сравнительные тесты, показав, что наш алгоритм достиг более высокой справедливости по сравнению с другими подходами, одновременно сохранив высокую точность прогнозирования. Наши результаты демонстрируют, что модель-агностичный подход может использоваться для любых моделей прогнозирования, даже если они уже были обучены на данных с несправедливостью. ## Значимость Наш подход может быть применен в различных сферах, где требуется справедливость в решениях, например, в здравоохранении, финансах, рекрутинге и в сфере юриспруд

Abstract

Predictive process monitoring enables organizations to proactively react and intervene in running instances of a business process. Given an incomplete process instance, predictions about the outcome, next activity, or remaining time are created. This is done by powerful machine learning models, which have shown impressive predictive performance. However, the data-driven nature of these models makes them susceptible to finding unfair, biased, or unethical patterns in the data. Such patterns lead to biased predictions based on so-called sensitive attributes, such as the gender or age of process participants. Previous work has identified this problem and offered solutions that mitigate biases by removing sensitive attributes entirely from the process instance. However, sensitive attributes can be used both fairly and unfairly in the same process instance. For example, during a medical process, treatment decisions could be based on gender, while the decision to accept a patient should not be based on gender. This paper proposes a novel, model-agnostic approach for identifying and rectifying biased decisions in predictive business process monitoring models, even when the same sensitive attribute is used both fairly and unfairly. The proposed approach uses a human-in-the-loop approach to differentiate between fair and unfair decisions through simple alterations on a decision tree model distilled from the original prediction model. Our results show that the proposed approach achieves a promising tradeoff between fairness and accuracy in the presence of biased data. All source code and data are publicly available at https://doi.org/10.5281/zenodo.15387576.

Ссылки и действия