No Need for "Learning" to Defer? A Training Free Deferral Framework to Multiple Experts through Conformal Prediction

2509.12573v1 cs.LG, cs.HC 2025-09-18
Авторы:

Tim Bary, Benoît Macq, Louis Petit

Резюме на русском

#### Контекст AI-системы, несмотря на высокую точность в задачах классификации, часто сталкиваются с недостатком уверенности в предсказаниях на определенных входных данных. Для решения этой проблемы возникла необходимость в развитии систем human-AI collaboration. Одним из способов улучшения этого процесса является метод Learning to Defer (L2D), который позволяет системе передавать неуверенные задачи эксперту. Однако существующие L2D-подходы требуют значительной подготовки и дорогостоящей переучивания, когда эксперты меняются или при изменении обстоятельств. Наша работа, No Need for "Learning" to Defer? A Training Free Deferral Framework to Multiple Experts through Conformal Prediction, предлагает новый, модельно-и экспертно-независимый подход для решения этой проблемы, основанный на технологии conformal prediction. #### Метод Мы предлагаем необучающую фреймворк, который определяет неопределенность уровня поддержки определенного класса в прогнозе с помощью conformal predictor. Данный подход работает с последовательностью множеств прогнозов для различных экспертов. Мы используем новый критерий segregativity, который определяет точность эксперта в разделении наиболее вероятных классов. Наша модель выбирает наиболее уверенного эксперта на основе этого критерия. Это позволяет работать с любыми моделями или экспертами без необходимости их переучивания. #### Результаты Мы провели эксперименты на двух высокоточных коллекциях данных CIFAR10-H и ImageNet16-H. Наши результаты показали, что наш подход показывает значительное улучшение в точности, стабилизируясь на уровне 99.57% и 99.40%, соответственно. Также мы увидели, что наш подход снижает нагрузку на экспертов до 11 раз, сохраняя высокую отчетливость в выборке. Даже при менеджменте уровня информации, наш алгоритм показывает только незначительное снижение точности, что делает его устойчивым и эффективным в различных условиях. #### Значимость Предлагаемый подход может быть использован в различных аспектах human-AI collaboration, где требуется высокая точность и устойчивость решений. Он отличается своей модельной и экспертной независимостью, что упрощает его применение в реальном мире. Этот фреймворк может быть применен для улучшения работы систем медицинской диагностики, поиска информации, и даже для задач проверки и анализа. #### Выводы Исследования показали, что модельно-экспертно независимый подход, основанный на conformal prediction, может предлагать эффективный и универсальный способ решения задач deferral без необходимости тренировки модели. Наша работа открывает путь для будущих исследований в области методов deferral, центрируясь на улучшении точности и устойчивости во взаимодействии с экспертами.

Abstract

AI systems often fail to deliver reliable predictions across all inputs, prompting the need for hybrid human-AI decision-making. Existing Learning to Defer (L2D) approaches address this by training deferral models, but these are sensitive to changes in expert composition and require significant retraining if experts change. We propose a training-free, model- and expert-agnostic framework for expert deferral based on conformal prediction. Our method uses the prediction set generated by a conformal predictor to identify label-specific uncertainty and selects the most discriminative expert using a segregativity criterion, measuring how well an expert distinguishes between the remaining plausible labels. Experiments on CIFAR10-H and ImageNet16-H show that our method consistently outperforms both the standalone model and the strongest expert, with accuracies attaining $99.57\pm0.10\%$ and $99.40\pm0.52\%$, while reducing expert workload by up to a factor of $11$. The method remains robust under degraded expert performance and shows a gradual performance drop in low-information settings. These results suggest a scalable, retraining-free alternative to L2D for real-world human-AI collaboration.

Ссылки и действия