Activation Subspaces for Out-of-Distribution Detection
2508.21695v1
cs.LG, cs.CV
2025-09-02
Авторы:
Barış Zöngür, Robin Hesse, Stefan Roth
Резюме на русском
#### Контекст
В глубоких сетях, используемых в реальных приложениях, важно уверенно различать входные данные, принадлежащие набору обучения (in-distribution, ID), от тех, которые выходят за его пределы (out-of-distribution, OOD). Несовершенство существующих OOD-методов заключается в том, что они недостаточно эффективно различают входные данные в зависимости от степени расхождения от тренировочного распределения. Это приводит к ошибкам в критических задачах, таких как диагностика, безопасность и мониторинг. Наша мотивация заключается в разработке метода, который эффективно применяется в разных режимах распределения, обеспечивая высокую точность и универсальность.
#### Метод
Мы предлагаем Activation Subspaces (ActSub), новый подход к OOD-детекции, основанный на разложении модели по сингулярным значениям весов классификационного слоя. Это декомпозиция активаций модели на два подпространства: "игнорируемые" (insignificant subspace) и "значимые" (decisive subspace). Игнорируемое подпространство, которое практически не влияет на классификацию, оказывается эффективным в распознавании OOD-данных, особенно при больших сдвигах распределений (Far-OOD). Значимое подпространство, в свою очередь, полезно для ситуаций с небольшими сдвигами (Near-OOD). Мы используем эти наблюдения для создания комбинированного подхода, объединяющего в себе две стратегии, что позволяет улучшить жидкость и точность OOD-детекции.
#### Результаты
Мы провести испытания на нескольких стандартных OOD-benchmarkах, включая CIFAR-10, CIFAR-100, ImageNet, и TinyImageNet. Метод ActSub показал лучшие результаты в сравнении с современными OOD-детекционными методами, существенно повысив точность и жидкость OOD-отделения. Мы показали, что игнорируемое подпространство значительно повышает эффективность OOD-отделения в Far-OOD, тогда как значимое подпространство демонстрирует лучшие результаты в Near-OOD. Эти результаты подтверждают гибкость ActSub и его высокую эффективность в различных сценариях.
#### Значимость
Метод ActSub может быть применен в различных критических приложениях, таких как мониторинг здоровья, сетевая безопасность, и анализ данных в реальном времени. Он обеспечивает улучшенную точность и универсальность в OOD-отделении, что может существенно повысить надежность и безопасность систем. Этот подход также может быть расширен для других задач, таких как гиперпараметрические анализы и поиск нежелательных признаков в данных.
#### Выводы
Мы предлагаем новый подход к OOD-детекции, который эффективно разделяет OOD и ID-данные в различных ситуациях распределения. Наши результаты показывают, что ActSub превосходит существующ
Abstract
To ensure the reliability of deep models in real-world applications,
out-of-distribution (OOD) detection methods aim to distinguish samples close to
the training distribution (in-distribution, ID) from those farther away (OOD).
In this work, we propose a novel OOD detection method that utilizes singular
value decomposition of the weight matrix of the classification head to
decompose the model's activations into decisive and insignificant components,
which contribute maximally, respectively minimally, to the final classifier
output. We find that the subspace of insignificant components more effectively
distinguishes ID from OOD data than raw activations in regimes of large
distribution shifts (Far-OOD). This occurs because the classification objective
leaves the insignificant subspace largely unaffected, yielding features that
are ''untainted'' by the target classification task. Conversely, in regimes of
smaller distribution shifts (Near-OOD), we find that activation shaping methods
profit from only considering the decisive subspace, as the insignificant
component can cause interference in the activation space. By combining two
findings into a single approach, termed ActSub, we achieve state-of-the-art
results in various standard OOD benchmarks.
Ссылки и действия
Дополнительные ресурсы: