Random forest-based out-of-distribution detection for robust lung cancer segmentation

2508.19112v1 eess.IV, cs.CV, cs.LG 2025-08-28
Авторы:

Aneesh Rangnekar, Harini Veeraraghavan

Резюме на русском

## Контекст Автоматическая детекция и сегментация раковых опухолей на изображениях полученных методом компьютерной томографии (CT) является критически важной задачей в области медицинского искусственного интеллекта. Это позволяет обеспечить точное планирование лечения и оценку эффективности терапии. Однако существуют значительные вызовы, связанные с точностью работы сегментационных моделей, особенно при использовании данных, отличающихся от обучающих (out-of-distribution, OOD). Традиционные модели часто не могут точно детектировать OOD случаи, что приводит к неточностям и нестабильности в работе систем. Мотивация для данного исследования заключается в разработке универсального метода, который мог бы улучшить надеждность сегментации в случаях, когда данные отличаются от обучающих. ## Метод Для решения этой проблемы предлагается использование Random Forest-based Out-of-Distribution Detection (RF-Deep). Этот подход использует deep features, полученные от предобученного transformer-based segmentation model, чтобы обнаружить OOD случаи. Модель представляет собой random forest classifier, который принимает deep features, полученные от Swin Transformer encoder. Этот encoder был предобучен с помощью masked image modeling (SimMIM) на большом количестве необъективированных 3D CT сканов, отражающих как раковые, так и здоровые ткани. Для сегментации легкоклеточных опухолей легких была использована convolution decoder. Модель была протестирована на 603 3D CT сканах, включавших один in-distribution (ID) games и четыре OOD datasets: chest CTs with pulmonary embolism (PE) и COVID-19, а также abdominal CTs с kidney cancers и healthy volunteers. ## Результаты Проведенные эксперименты показали, что RF-Deep достигает значительной точности в детекции OOD случаев. Он обнаруживает OOD cases с FPR95 равным 18.26% на PE, 27.66% на COVID-19, и менее 0.1% на abdominal CTs. Это значительно превосходит существующие OOD detection approaches. Благодаря использованию deep features, RF-Deep увеличивает надежность сегментации в области cancer segmentation, даже при работе с нестандартными данными. ## Значимость Результаты этого исследования имеют широкие приложения в области медицинского искусственного интеллекта. Они могут быть применены для улучшения надежности сегментации раковых опухолей в различных клинических сценариях, включая OOD случаи. Это имеет перспективы для повышения точности планирования лечения и оценки терапии. Разработанный подход также открывает возможности для дальнейшего исследования в области OOD detection, стабилизации моделей и улучшения их универсальности. ## Выводы Разработанный RF-Deep подход является простым и эффективным инструментом для улучшения надежности сегментации раковых опухолей в ID и OOD сценариях. Он устанавливает новый стандарт точности и надежности в данной области. Будущие работы будут сосредоточены на расширении применений этого

Abstract

Accurate detection and segmentation of cancerous lesions from computed tomography (CT) scans is essential for automated treatment planning and cancer treatment response assessment. Transformer-based models with self-supervised pretraining can produce reliably accurate segmentation from in-distribution (ID) data but degrade when applied to out-of-distribution (OOD) datasets. We address this challenge with RF-Deep, a random forest classifier that utilizes deep features from a pretrained transformer encoder of the segmentation model to detect OOD scans and enhance segmentation reliability. The segmentation model comprises a Swin Transformer encoder, pretrained with masked image modeling (SimMIM) on 10,432 unlabeled 3D CT scans covering cancerous and non-cancerous conditions, with a convolution decoder, trained to segment lung cancers in 317 3D scans. Independent testing was performed on 603 3D CT public datasets that included one ID dataset and four OOD datasets comprising chest CTs with pulmonary embolism (PE) and COVID-19, and abdominal CTs with kidney cancers and healthy volunteers. RF-Deep detected OOD cases with a FPR95 of 18.26%, 27.66%, and less than 0.1% on PE, COVID-19, and abdominal CTs, consistently outperforming established OOD approaches. The RF-Deep classifier provides a simple and effective approach to enhance reliability of cancer segmentation in ID and OOD scenarios.

Ссылки и действия