No Need for "Learning" to Defer? A Training Free Deferral Framework to Multiple Experts through Conformal Prediction
2509.12573v1
cs.LG, cs.HC
2025-09-18
Авторы:
Tim Bary, Benoît Macq, Louis Petit
Резюме на русском
#### Контекст
AI-системы, несмотря на высокую точность в задачах классификации, часто сталкиваются с недостатком уверенности в предсказаниях на определенных входных данных. Для решения этой проблемы возникла необходимость в развитии систем human-AI collaboration. Одним из способов улучшения этого процесса является метод Learning to Defer (L2D), который позволяет системе передавать неуверенные задачи эксперту. Однако существующие L2D-подходы требуют значительной подготовки и дорогостоящей переучивания, когда эксперты меняются или при изменении обстоятельств. Наша работа, No Need for "Learning" to Defer? A Training Free Deferral Framework to Multiple Experts through Conformal Prediction, предлагает новый, модельно-и экспертно-независимый подход для решения этой проблемы, основанный на технологии conformal prediction.
#### Метод
Мы предлагаем необучающую фреймворк, который определяет неопределенность уровня поддержки определенного класса в прогнозе с помощью conformal predictor. Данный подход работает с последовательностью множеств прогнозов для различных экспертов. Мы используем новый критерий segregativity, который определяет точность эксперта в разделении наиболее вероятных классов. Наша модель выбирает наиболее уверенного эксперта на основе этого критерия. Это позволяет работать с любыми моделями или экспертами без необходимости их переучивания.
#### Результаты
Мы провели эксперименты на двух высокоточных коллекциях данных CIFAR10-H и ImageNet16-H. Наши результаты показали, что наш подход показывает значительное улучшение в точности, стабилизируясь на уровне 99.57% и 99.40%, соответственно. Также мы увидели, что наш подход снижает нагрузку на экспертов до 11 раз, сохраняя высокую отчетливость в выборке. Даже при менеджменте уровня информации, наш алгоритм показывает только незначительное снижение точности, что делает его устойчивым и эффективным в различных условиях.
#### Значимость
Предлагаемый подход может быть использован в различных аспектах human-AI collaboration, где требуется высокая точность и устойчивость решений. Он отличается своей модельной и экспертной независимостью, что упрощает его применение в реальном мире. Этот фреймворк может быть применен для улучшения работы систем медицинской диагностики, поиска информации, и даже для задач проверки и анализа.
#### Выводы
Исследования показали, что модельно-экспертно независимый подход, основанный на conformal prediction, может предлагать эффективный и универсальный способ решения задач deferral без необходимости тренировки модели. Наша работа открывает путь для будущих исследований в области методов deferral, центрируясь на улучшении точности и устойчивости во взаимодействии с экспертами.
Abstract
AI systems often fail to deliver reliable predictions across all inputs,
prompting the need for hybrid human-AI decision-making. Existing Learning to
Defer (L2D) approaches address this by training deferral models, but these are
sensitive to changes in expert composition and require significant retraining
if experts change. We propose a training-free, model- and expert-agnostic
framework for expert deferral based on conformal prediction. Our method uses
the prediction set generated by a conformal predictor to identify
label-specific uncertainty and selects the most discriminative expert using a
segregativity criterion, measuring how well an expert distinguishes between the
remaining plausible labels. Experiments on CIFAR10-H and ImageNet16-H show that
our method consistently outperforms both the standalone model and the strongest
expert, with accuracies attaining $99.57\pm0.10\%$ and $99.40\pm0.52\%$, while
reducing expert workload by up to a factor of $11$. The method remains robust
under degraded expert performance and shows a gradual performance drop in
low-information settings. These results suggest a scalable, retraining-free
alternative to L2D for real-world human-AI collaboration.
Ссылки и действия
Дополнительные ресурсы: