Out-of-Distribution Detection using Counterfactual Distance

2508.10148v1 cs.LG, cs.AI 2025-08-15
Авторы:

Maria Stoica, Francesco Leofante, Alessio Lomuscio

Резюме на русском

#### Контекст Обнаружение данных вне распределения (OOD) является ключевым заданием в области машинного обучения, особенно в сферах, требующих высокой надежности и безопасности, таких как медицина, автопилоты и системы мониторинга. Несанкционированные входы, которые выходят за пределы обучающих данных, могут привести к серьезным ошибкам и непредсказуемости. Несмотря на высокую точность современных моделей, они часто не в состоянии точно определять OOD-данные, что делает их применение в реальных условиях опасным. Более того, многие существующие подходы не обеспечивают достаточной прозрачности, что снижает доверие пользователей. Эти проблемы подчеркивают необходимость развития методов OOD-обнаружения, которые обеспечат как точность, так и возможность пояснения решений. #### Метод Метод, предложенный в статье, основан на использовании **counterfactual explanations** для вычисления расстояния до разделяющих поверхностей (decision boundaries) в многоклассовых вопросах. Такие расчеты позволяют определить, насколько данный вход отличается от обучающих примеров. Для улучшения производительности и эффективности, авторы предлагают рассчитывать используемые расстояния непосредственно в пространстве эмбеддингов, а не в полном пространстве признаков. Это позволяет избежать дорогостоящих вычислений во всех нейрослоях, что особенно важно для больших моделей. Метод представляет собой **post-hoc** подход, что означает, что он может быть применен к уже обученным моделям без необходимости изменять их архитектуру. #### Результаты Авторы демонстрируют эффективность своего подхода с помощью экспериментов на фреймворках CIFAR-10, CIFAR-100 и ImageNet-200. На CIFAR-10 метод достиг высокой точности — AUROC 93.50% и низкой частоты ложноположительных результатов (FPR95 25.80%). На более сложном наборе данных CIFAR-100, где OOD-данные часто напоминают схожие классы, полученные результаты значительно превосходят конкурентные подходы: AUROC 97.05% и FPR95 13.79%. На большом наборе данных ImageNet-200, кросс-валидация по четырём OOD-данным подтвердила высокую общую точность — AUROC 92.55% и FPR95 33.55%. Эти результаты подтверждают, что способ авторов способен эффективно обнаруживать OOD-данные в разных условиях. #### Значимость Метод оказался полезен для приложений, требующих высокой точности обнаружения OOD, таких как автоматизация процессов, безопасность систем управления и мониторинга. Его преимущество в том, что он обеспечивает не только высокую точность, но также и понятность решений благодаря использованию counterfactual explanations. Эти свойства делают его применимы

Abstract

Accurate and explainable out-of-distribution (OOD) detection is required to use machine learning systems safely. Previous work has shown that feature distance to decision boundaries can be used to identify OOD data effectively. In this paper, we build on this intuition and propose a post-hoc OOD detection method that, given an input, calculates the distance to decision boundaries by leveraging counterfactual explanations. Since computing explanations can be expensive for large architectures, we also propose strategies to improve scalability by computing counterfactuals directly in embedding space. Crucially, as the method employs counterfactual explanations, we can seamlessly use them to help interpret the results of our detector. We show that our method is in line with the state of the art on CIFAR-10, achieving 93.50% AUROC and 25.80% FPR95. Our method outperforms these methods on CIFAR-100 with 97.05% AUROC and 13.79% FPR95 and on ImageNet-200 with 92.55% AUROC and 33.55% FPR95 across four OOD datasets

Ссылки и действия