📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
📄 A Human-In-The-Loop Approach for Improving Fairness in Predictive Business Process Monitoring
2025-08-27Авторы:
Martin Käppel, Julian Neuberger, Felix Möhrlein, Sven Weinzierl, Martin Matzner, Stefan Jablonski
## Контекст
Предвидение бизнес-процессов (predictive process monitoring) позволяет организациям прогнозировать поток действий в процессах на ранней стадии их выполнения. Это позволяет проводить проактивные действия и корректировки. Используя мощные машинное обучение, такие модели достигли впечатляющих результатов в прогнозировании итогов, следующих действий и оставшихся временных интервалов. Однако, данные-ориентированная природа этих моделей делает их чувствительными к наличию несправедливости и мотивированной дискриминации в данных. Такие модели могут использоваться с учетом законов и морали, но могут также включать в себя несправедливые решения, основываясь на таких атрибутах, как пол или возраст участников процесса. Многие работы старались устранять эти проблемы, но часто подходы включают в себя лишение моделей от анализа таких атрибутов, что может привести к потере важной информации. Наша работа сосредотачивается на поиске баланса между правильным использованием и устранением несправедливости в моделях.
## Метод
Мы предлагаем модель-агностичный подход, основанный на интерактивной интерпретации, который может работать со существующими моделями бизнес-процессов. Мы используем закодированный декістром деревом модели, которое позволяет извлекать простые правила, которые регулируют решение. Наш подход работает с участием человека, который может руководствовать процесс правильной интерпретации. Мы используем технологии, которые позволяют отличать безопасные, справедливые решения от небезопасных, дискриминационных. Метод может вести регулирование как на уровне модели, так и на уровне конкретных действий. Благодаря этому, наш подход может проверить и урегулировать дискриминацию в бизнес-процессах без полной исключения существенных атрибутов.
## Результаты
Мы провели эксперименты на реальных данных, использовав три разных бизнес-процесса. Мы показали, что наш подход может улучшить справедливость решений в ситуациях, где потеря данных может привести к несправедливым решениям. Использовав человека в цикле (human-in-the-loop), мы провели сравнительные тесты, показав, что наш алгоритм достиг более высокой справедливости по сравнению с другими подходами, одновременно сохранив высокую точность прогнозирования. Наши результаты демонстрируют, что модель-агностичный подход может использоваться для любых моделей прогнозирования, даже если они уже были обучены на данных с несправедливостью.
## Значимость
Наш подход может быть применен в различных сферах, где требуется справедливость в решениях, например, в здравоохранении, финансах, рекрутинге и в сфере юриспруд
Annotation:
Predictive process monitoring enables organizations to proactively react and
intervene in running instances of a business process. Given an incomplete
process instance, predictions about the outcome, next activity, or remaining
time are created. This is done by powerful machine learning models, which have
shown impressive predictive performance. However, the data-driven nature of
these models makes them susceptible to finding unfair, biased, or unethical
patterns in the data. Such patterns lead ...
Авторы:
Omri Ben-Dov, Samira Samadi, Amartya Sanyal, Alexandru Ţifrea
## Контекст
В современном мире машинного обучения становится все более важной частью жизни, приложения и систем. Однако многие модели могут сохранять биасы, присутствующие в тренировочных данных, что приводит к несправедливости в трактовке данных, особенно для меньшинств. Это проблема возникает из-за того, что традиционные методы снижения биаса часто требуют затрат на ресурсы и поддержки от организаций. Более того, такие методы могут привести к потерям в эффективности модели. Здесь мы рассматриваем рамку **Algorithmic Collective Action (ACA)**, в рамках которой группы пользователей могут самостоятельно работать над улучшением справедливости моделей, используя свои собственные данные. Это подход может устранять необходимость в постоянной организации и взаимодействии с организациями, чтобы добиться справедливости.
## Метод
Мы предлагаем модель алгоритмического самоорганизованного действия, ориентированную на снижение несправедливости в моделях машинного обучения, используя данные, предоставленные пользователями. Методы основываются на **collective label relabeling**, где пользователи используют свои данные для повышения справедливости. Мы предлагаем три модели, которые представляют собой методы **relabeling**, которые могут быть урезаны до минимального количества данных и могут быть работать с любыми моделями машинного обучения. Данные были сгруппированы по уровням доверия, чтобы обеспечить эффективное использование данных.
## Результаты
Мы проводили эксперименты с данными, собранными с разных источников, в том числе **Census Income Dataset**, и проверяли эффективность данных методов. Наши результаты показывают, что даже небольшие группы пользователей, работающие совместно, могут существенно снизить несправедливость в моделей, не влияя на общую точность модели. Мы также показали, что наш подход может быть использован в различных типах данных и моделях. Это значит, что это может быть применено в различных областях, как в социальных сетях, так и в здравоохранении.
## Значимость
Наш подход может быть применен в многих областях, где существуют проблемы с несправедливостью в моделях машинного обучения. Это может быть полезно в **здравоохранении**, **рекламных системах**, **финансовых моделях** и других сферах. Особым преимуществом является то, что пользователи могут значительно снизить несправедливость, не требуя организационного вмешательства. Это может привести к **более справедливым решениям** в различных системах, где существуют проблемы с биасами.
## Выводы
Мы показали, что наш подход **Algorithmic Collective Action** может быть мощным инструментом для создания более справедливых моде
Annotation:
Machine learning models often preserve biases present in training data,
leading to unfair treatment of certain minority groups. Despite an array of
existing firm-side bias mitigation techniques, they typically incur utility
costs and require organizational buy-in. Recognizing that many models rely on
user-contributed data, end-users can induce fairness through the framework of
Algorithmic Collective Action, where a coordinated minority group strategically
relabels its own data to enhance fairnes...
Авторы:
Andrea Castellani, Zacharias Papadovasilakis, Giorgos Papoutsoglou, Mary Cole, Brian Bautsch, Tobias Rodemann, Ioannis Tsamardinos, Angela Harden
## Контекст
Транспортные происшествия остаются лидирующим фактором травматизма и смертности во всем мире. Несмотря на существующие меры безопасности, необходимо развитие новых данных-д basед подходов для точного прогнозирования и устранения серьезных последствий. Особенно критичным является вопрос об определении и интерпретации ключевых факторов, влияющих на уровень травм и серьезности аварий. Такие факторы могут включать в себя демографические, экологические, технические и операционные аспекты. Целью данного исследования является разработка прозрачной и повторяемой методологии, основанной на автоматизированных методах машинного обучения и исследовании их интерпретации, чтобы улучшить понимание факторов, влияющих на серьезность аварий.
## Метод
Исследование основывается на широком датасете, содержащем более 3 миллионов записей о авариях, собранных над этим штатом в течение шести лет (2017–2022). Данные были агрегированы до уровня транспортных средств, составив 2,3 миллиона записей для анализа. Для построения прогностических моделей была применена методология, объединяющая Автоматизированное Машинное Обучение (AutoML) и Объяснимая Искусственная Интеллектуальная Система (Explainable AI), в частности, технику SHapley Additive exPlanations (SHAP). Эти технологии позволили выделить и интерпретировать значимые факторы, влияющие на серьезность аварий. Модели были обучены и проверены на разнородных данных с использованием многочленной логистической регрессии, чтобы обеспечить лучшую читаемость и понимание результатов.
## Результаты
Используя методы AutoML, были построены модели, отличающие серьезные от несерьезных аварий. Модели были проверены в условиях тестового сета, получив AUC-ROC в 84,9%. Значимыми факторами оказались 17 признаков, среди которых: тип места происшествия, установленная скорость, возраст салонных пассажиров, действия до аварии. Особое внимание было уделено прозрачности интерпретации результатов. Например, какие-то традиционно важные факторы, такие как алкогольное опьянение, оказались менее важными, чем экологические и контекстуальные переменные. Это демонстрирует мощь нового подхода, который ценит точность и понимание результатов выше простого предсказания.
## Значимость
Разработанный подход может применяться в различных сферах, включая транспортную безопасность, страхование, городской планирование и машинное обучение. Он предоставляет новый способ интерпретировать данные, чтобы понять, какие факторы влияют на
Annotation:
Motor vehicle crashes remain a leading cause of injury and death worldwide,
necessitating data-driven approaches to understand and mitigate crash severity.
This study introduces a curated dataset of more than 3 million people involved
in accidents in Ohio over six years (2017-2022), aggregated to more than 2.3
million vehicle-level records for predictive analysis. The primary contribution
is a transparent and reproducible methodology that combines Automated Machine
Learning (AutoML) and explaina...
Авторы:
Petr Spelda, Vit Stritecky
## Контекст
Оценка моделей логического рассуждения и их перспективные модели области исследования в последнее время привлекла большой интерес. Известно, что модели могут объединять существующие способности в новые цепочки последовательных шагов, которые могут помочь им лучше соответствовать новым ситуациям. Однако проблема заключается в том, что навык последовательного рассуждения, как правило, развивается не постоянно, а в зависимости от типа задач и используемых методов. Эта неоднородность делает необходимым подробное изучение моделей и их результатов, особенно в критически важных задачах. В настоящем исследовании уделяется внимание определенной модели, которая использует сложные тестовые задачи для развития способности рассуждать, что может стать новым направлением в области глубокого обучения.
## Метод
Метод, использованный в исследовании, основывается на построении последовательных проблем, которые стремятся к постоянному улучшению моделей рассуждения. Эта последовательность задач, в данном случае из серии "Humanity's Last Exam", используется как бенчмарк для развития моделей. Было показано, что модели, сталкивающиеся с усложненными тестами, способны лучше приспособиться к новым задачам в своей области. Основное техническое решение заключается в использовании сложности задач, которые модель должна решать с целью улучшения своих прогностических способностей. Это позволяет не только улучшать модель, но и измерять ее уровень общей обобщающей способности.
## Результаты
В результате исследования были проведены эксперименты, в ходе которых были выделены определенные моменты, где модель DeepSeek-R1 показала лучшую производительность в сравнении с другими моделями. Эти результаты достигнуты благодаря использованию бенчмарков, которые не только измеряют модель, но и становятся частью процесса обучения. Было показано, что модель DeepSeek-R1 превзошла другие модели в тестах, где необходимо было применять последовательное решение проблем. Таким образом, модель DeepSeek-R1 становится примером того, что развитие моделей рассуждения может быть более эффективным, когда они конкретно тренируются с использованием усложненных задач.
## Значимость
Результаты имеют значительное значение в области машинного обучения, поскольку показывают, что новизна и сложность тестовых задач могут играть ключевую роль в улучшении моделей. Этот подход может быть применен не только в развитии моделей логического рассуждения, но и в других областях, где требуется постоянное улучшение способности моделей. Использование бенчмарков как базы для обучения моделей может стать новым направлением в обучении моделей, ко
Annotation:
Evaluation of reasoning language models gained importance after it was
observed that they can combine their existing capabilities into novel traces of
intermediate steps before task completion and that the traces can sometimes
help them to generalize better than past models. As reasoning becomes the next
scaling dimension of large language models, careful study of their capabilities
in critical tasks is needed. We show that better performance is not always
caused by test-time algorithmic improve...
Показано 31 -
34
из 34 записей