COMPASS: Robust Feature Conformal Prediction for Medical Segmentation Metrics

2509.22240v1 eess.IV, cs.CV, cs.LG, stat.AP, stat.ML 2025-09-30
Авторы:

Matt Y. Cheung, Ashok Veeraraghavan, Guha Balakrishnan

Резюме на русском

## Контекст В клинических приложениях, ценность сегментационных моделей часто определяется достоверностью полученных внешней метрики, таких как размер органа, а не пиксельной точностью сегментационных масок. Таким образом, квантификация неопределенности для таких метрик является критически важной для принятия обоснованных решений. Конформное предсказание (CP) — это популярная фреймворк для вывода подобных гарантий неопределенности, однако применение CP в непосредственном виде к окончательной скалярной метрике является неэффективным, так как он рассматривает нелинейную пайплайн сегментации-к-метрике в качестве черного ящика. Мы предлагаем COMPASS, усовершенствованный фреймворк, который генерирует эффективные, метрические CP-интервалы для изображений сегментации, используя индуктивные подсказки от глубоких нейронных сетей. COMPASS выполняет калибровку непосредственно в пространстве моделей представления, изменяя внутренние черты вдоль низкоразмерных подпространств, максимально чувствительных к целевой метрике. Мы доказали, что COMPASS обеспечивает достоверную покрытие маргинальное в случае заменяемости и вложенного свойства. ## Метод COMPASS является продвинутым подходом к квантификации неопределенности для метрик сегментации, используя мощь глубоких нейронных сетей. Он переносит процесс калибровки непосредственно в пространство внутренних представлений модели, а не работает с метрикой в качестве черного ящика. Основная идея заключается в использовании переноса представлений модели для построения валидных интервалов CP. Мы используем технологию переноса функций, чтобы определить низкоразмерные подпространства, которые имеют наибольшее влияние на целевую метрику. Эти подпространства используются для проведения калибровочных изменений, чтобы построить CP-интервалы. Мы доказали, что этот подход сохраняет валидность покрытия с учетом обменности и вложенности. ## Результаты Мы проверили эффективность COMPASS на четырёх задачах медицинской сегментации, включая оценку площади глаза и анатомических структур. Результаты показали, что COMPASS генерирует значительно тоньшие интервалы по сравнению с традиционными методами CP. Мы также продемонстрировали, что COMPASS поддерживает достоверность процедуры при ковариатных сдвигах, используя внутренние представления для оценки весов важности. Это доказывает, что COMPASS может обеспечить достоверную квантификацию неопределенности, даже в условиях изменения входных данных. ## Значимость COMPASS может применяться в медицинских приложениях для улучшения достоверности клинических определений, основанных на сегментационных моделях. Его преим

Abstract

In clinical applications, the utility of segmentation models is often based on the accuracy of derived downstream metrics such as organ size, rather than by the pixel-level accuracy of the segmentation masks themselves. Thus, uncertainty quantification for such metrics is crucial for decision-making. Conformal prediction (CP) is a popular framework to derive such principled uncertainty guarantees, but applying CP naively to the final scalar metric is inefficient because it treats the complex, non-linear segmentation-to-metric pipeline as a black box. We introduce COMPASS, a practical framework that generates efficient, metric-based CP intervals for image segmentation models by leveraging the inductive biases of their underlying deep neural networks. COMPASS performs calibration directly in the model's representation space by perturbing intermediate features along low-dimensional subspaces maximally sensitive to the target metric. We prove that COMPASS achieves valid marginal coverage under exchangeability and nestedness assumptions. Empirically, we demonstrate that COMPASS produces significantly tighter intervals than traditional CP baselines on four medical image segmentation tasks for area estimation of skin lesions and anatomical structures. Furthermore, we show that leveraging learned internal features to estimate importance weights allows COMPASS to also recover target coverage under covariate shifts. COMPASS paves the way for practical, metric-based uncertainty quantification for medical image segmentation.

Ссылки и действия