A Human-In-The-Loop Approach for Improving Fairness in Predictive Business Process Monitoring
2508.17477v1
cs.LG, cs.CY, 68T07, 68T01, 68U35
2025-08-27
Авторы:
Martin Käppel, Julian Neuberger, Felix Möhrlein, Sven Weinzierl, Martin Matzner, Stefan Jablonski
Резюме на русском
## Контекст
Предвидение бизнес-процессов (predictive process monitoring) позволяет организациям прогнозировать поток действий в процессах на ранней стадии их выполнения. Это позволяет проводить проактивные действия и корректировки. Используя мощные машинное обучение, такие модели достигли впечатляющих результатов в прогнозировании итогов, следующих действий и оставшихся временных интервалов. Однако, данные-ориентированная природа этих моделей делает их чувствительными к наличию несправедливости и мотивированной дискриминации в данных. Такие модели могут использоваться с учетом законов и морали, но могут также включать в себя несправедливые решения, основываясь на таких атрибутах, как пол или возраст участников процесса. Многие работы старались устранять эти проблемы, но часто подходы включают в себя лишение моделей от анализа таких атрибутов, что может привести к потере важной информации. Наша работа сосредотачивается на поиске баланса между правильным использованием и устранением несправедливости в моделях.
## Метод
Мы предлагаем модель-агностичный подход, основанный на интерактивной интерпретации, который может работать со существующими моделями бизнес-процессов. Мы используем закодированный декістром деревом модели, которое позволяет извлекать простые правила, которые регулируют решение. Наш подход работает с участием человека, который может руководствовать процесс правильной интерпретации. Мы используем технологии, которые позволяют отличать безопасные, справедливые решения от небезопасных, дискриминационных. Метод может вести регулирование как на уровне модели, так и на уровне конкретных действий. Благодаря этому, наш подход может проверить и урегулировать дискриминацию в бизнес-процессах без полной исключения существенных атрибутов.
## Результаты
Мы провели эксперименты на реальных данных, использовав три разных бизнес-процесса. Мы показали, что наш подход может улучшить справедливость решений в ситуациях, где потеря данных может привести к несправедливым решениям. Использовав человека в цикле (human-in-the-loop), мы провели сравнительные тесты, показав, что наш алгоритм достиг более высокой справедливости по сравнению с другими подходами, одновременно сохранив высокую точность прогнозирования. Наши результаты демонстрируют, что модель-агностичный подход может использоваться для любых моделей прогнозирования, даже если они уже были обучены на данных с несправедливостью.
## Значимость
Наш подход может быть применен в различных сферах, где требуется справедливость в решениях, например, в здравоохранении, финансах, рекрутинге и в сфере юриспруд
Abstract
Predictive process monitoring enables organizations to proactively react and
intervene in running instances of a business process. Given an incomplete
process instance, predictions about the outcome, next activity, or remaining
time are created. This is done by powerful machine learning models, which have
shown impressive predictive performance. However, the data-driven nature of
these models makes them susceptible to finding unfair, biased, or unethical
patterns in the data. Such patterns lead to biased predictions based on
so-called sensitive attributes, such as the gender or age of process
participants. Previous work has identified this problem and offered solutions
that mitigate biases by removing sensitive attributes entirely from the process
instance. However, sensitive attributes can be used both fairly and unfairly in
the same process instance. For example, during a medical process, treatment
decisions could be based on gender, while the decision to accept a patient
should not be based on gender. This paper proposes a novel, model-agnostic
approach for identifying and rectifying biased decisions in predictive business
process monitoring models, even when the same sensitive attribute is used both
fairly and unfairly. The proposed approach uses a human-in-the-loop approach to
differentiate between fair and unfair decisions through simple alterations on a
decision tree model distilled from the original prediction model. Our results
show that the proposed approach achieves a promising tradeoff between fairness
and accuracy in the presence of biased data. All source code and data are
publicly available at https://doi.org/10.5281/zenodo.15387576.