Synthetic Data-Driven Multi-Architecture Framework for Automated Polyp Segmentation Through Integrated Detection and Mask Generation
2508.06170v1
cs.CV, cs.AI
2025-08-12
Авторы:
Ojonugwa Oluwafemi Ejiga Peter, Akingbola Oluwapemiisin, Amalahu Chetachi, Adeniran Opeyemi, Fahmi Khalifa, Md Mahmudur Rahman
Резюме на русском
#### Контекст
Колоноскопия является важной методологией для раннего аудитории колоректального рака, который является одной из ведущих причин смертности от рака. Однако применение этого метода сталкивается с некоторыми ограничениями, включая ограниченные размеры здравоохранеточных данных и сложности в аннотации данных. Эти ограничения могут привести к неточностям в диагностике и снижению качества лечения. Исследование предлагает новую, многонаправленную архитектуру, которая автоматизирует процесс детекции и сегментации полипов на изображениях колоноскопии. Целью является решение проблем, связанных с недостатком больших данных и сложностями в их аннотации, для повышения точности диагностики.
#### Метод
Исследование вводит многоаспектную архитектуру для автоматизации детекции и сегментации полипов. Основные компоненты этого подхода:
1. **Синтетическая генерация данных** — используется Stable Diffusion для повышения разнообразия и качества синтетических данных.
2. **Обнаружение полипов** — Faster R-CNN используется для первого локализации объектов, а Segment Anything Model (SAM) создает точные маски сегментации.
3. **Сегментационные модели** — оценивались пять современных сегментационных моделей: U-Net, PSPNet, FPN, LinkNet, MANet, основанные на ResNet34.
#### Результаты
Эксперименты показали высокую эффективность предложенной системы. Faster R-CNN достиг значений recall 93.08%, precision 88.97% и F1-score 90.98%. Оценка сегментационных моделей демонстрирует следующие результаты:
- **FPN** показал наилучшие результаты с PSNR 7.205893 и SSIM 0.492381.
- **U-Net** выделился с высоким recall (84.85%) и быстростью обучения.
- **LinkNet** показал балансированные результаты с IoU 64.20% и Dice score 77.53%.
#### Значимость
Предложенная система обладает широкими перспективами в здравоохранении, особенно в сфере колоректального диагностирования. Она может решить проблемы нехватки данных и сложности аннотации, улучшив точность в диагностике и предотвращении колоректального рака. Многоаспектный подход также может быть применен в других областях медицинской интеллектуальной обработки изображений.
#### Выводы
Представленная работа достигла значительных улучшений в автоматизации детекции и сегментации полипов в колоноскопических изображениях. Основной достигнутый результат — синтез качественных синтетических данных и сравнительная оценка современных сегментационных моделей. Будущие исследования будут фокусироваться на дальнейшем улучшении точности и выносливости системы в разных медицинских приложениях.
Abstract
Colonoscopy is a vital tool for the early diagnosis of colorectal cancer,
which is one of the main causes of cancer-related mortality globally; hence, it
is deemed an essential technique for the prevention and early detection of
colorectal cancer. The research introduces a unique multidirectional
architectural framework to automate polyp detection within colonoscopy images
while helping resolve limited healthcare dataset sizes and annotation
complexities. The research implements a comprehensive system that delivers
synthetic data generation through Stable Diffusion enhancements together with
detection and segmentation algorithms. This detection approach combines Faster
R-CNN for initial object localization while the Segment Anything Model (SAM)
refines the segmentation masks. The faster R-CNN detection algorithm achieved a
recall of 93.08% combined with a precision of 88.97% and an F1 score of
90.98%.SAM is then used to generate the image mask. The research evaluated five
state-of-the-art segmentation models that included U-Net, PSPNet, FPN, LinkNet,
and MANet using ResNet34 as a base model. The results demonstrate the superior
performance of FPN with the highest scores of PSNR (7.205893) and SSIM
(0.492381), while UNet excels in recall (84.85%) and LinkNet shows balanced
performance in IoU (64.20%) and Dice score (77.53%).
Ссылки и действия
Дополнительные ресурсы: