Towards Trustworthy Breast Tumor Segmentation in Ultrasound using Monte Carlo Dropout and Deep Ensembles for Epistemic Uncertainty Estimation
2508.17768v1
eess.IV, cs.CV
2025-08-27
Авторы:
Toufiq Musah, Chinasa Kalaiwo, Maimoona Akram, Ubaida Napari Abdulai, Maruf Adewole, Farouk Dako, Adaobi Chiazor Emegoakor, Udunna C. Anazodo, Prince Ebenezer Adjei, Confidence Raymond
Резюме на русском
#### ## Контекст
В области медицинского изображения, автоматизированная сегментация тканей и злокачественных образований играет ключевую роль в повышении точности диагностики и характеристики заболеваний. Однако сегментация зон болезни в ультразвуковых изображениях груди (B-mode ultrasound imaging, BUS) сталкивается с тем, что данные часто содержат артефакты и несогласованности, что затрудняет получение надежных моделей. Более того, недостаточное упорядочение в выборках данных может привести к улучшению внутри-доменной точности моделей, не обеспечивая качественную общезначимость и надежную оценку нарушений домена (domain shift). В нашем исследовании мы сосредоточились на этих проблемах, применяя модель с упрощенным архитектурой Residual Encoder U-Net для сегментации тканей в ультразвуковых изображениях груди (BUS). Наша модель также оценивает неопределенность модели (uncertainty quantification), чтобы улучшить надежность модели в клиническом применении.
#### ## Метод
Мы использовали улучшенную архитектуру Residual Encoder U-Net, которая носит нейронный сетевой архитектурный тип с рекуррентными модулями. Методом Monte Carlo Dropout мы оценивали **неопределенность еррорности (epistemic uncertainty)**, а с помощью Deep Ensembles мы сравнили ее с другими типами неопределенности. Мы выделили и исправили дублирование данных в BUSI-данных, чтобы повысить надежность оценки общего потенциала модели. Были проведены эксперименты, используя дедуплицированную выборку для точного определения качества модели. Мы также проверили надежность модели для внутри-доменной (in-distribution) и меж-доменной (out-of-distribution) сегментации.
#### ## Результаты
Модель показала высокую точность сегментации на Breast-Lesion-USG датасете в условиях in-distribution, достигнув новых рекордов в отношении автоматического разметки тканей и злокачественных образований. Мы также доказали, что Monte Carlo Dropout и Deep Ensembles эффективно оценивали неопределенность, отделяя точные от неточных области модели. Однако при оценке на out-of-distribution данных, точность уменьшилась, и модель стала избыточно неуверенна в задачах сегментации. Этот результат подтвердил трудности, связанные с domain shift, которые остаются открытыми в области медицинских изображений.
#### ## Значимость
Модель, оценивающая её неопределенность, может быть применена в клинической практике для улучшения надежности и точности диагностики. Наша работа подтверждает важность добавления механизмов, которые позволяют модели правильно оценивать свой доверительный интервал при работе с нестандартными или неизвестными данными. Это делает модель более надежной и востребованной в клиническом применении, где требуется высокая защищенность и надежность.
#### ## Выводы
Мы показали, что модель с техникой Monte Carlo Dropout и Deep Ensembles может эффективно
Abstract
Automated segmentation of BUS images is important for precise lesion
delineation and tumor characterization, but is challenged by inherent artifacts
and dataset inconsistencies. In this work, we evaluate the use of a modified
Residual Encoder U-Net for breast ultrasound segmentation, with a focus on
uncertainty quantification. We identify and correct for data duplication in the
BUSI dataset, and use a deduplicated subset for more reliable estimates of
generalization performance. Epistemic uncertainty is quantified using Monte
Carlo dropout, deep ensembles, and their combination. Models are benchmarked on
both in-distribution and out-of-distribution datasets to demonstrate how they
generalize to unseen cross-domain data. Our approach achieves state-of-the-art
segmentation accuracy on the Breast-Lesion-USG dataset with in-distribution
validation, and provides calibrated uncertainty estimates that effectively
signal regions of low model confidence. Performance declines and increased
uncertainty observed in out-of-distribution evaluation highlight the persistent
challenge of domain shift in medical imaging, and the importance of integrated
uncertainty modeling for trustworthy clinical deployment. \footnote{Code
available at: https://github.com/toufiqmusah/nn-uncertainty.git}
Ссылки и действия
Дополнительные ресурсы: