Synthetic Data-Driven Multi-Architecture Framework for Automated Polyp Segmentation Through Integrated Detection and Mask Generation

2508.06170v1 cs.CV, cs.AI 2025-08-12
Авторы:

Ojonugwa Oluwafemi Ejiga Peter, Akingbola Oluwapemiisin, Amalahu Chetachi, Adeniran Opeyemi, Fahmi Khalifa, Md Mahmudur Rahman

Резюме на русском

#### Контекст Колоноскопия является важной методологией для раннего аудитории колоректального рака, который является одной из ведущих причин смертности от рака. Однако применение этого метода сталкивается с некоторыми ограничениями, включая ограниченные размеры здравоохранеточных данных и сложности в аннотации данных. Эти ограничения могут привести к неточностям в диагностике и снижению качества лечения. Исследование предлагает новую, многонаправленную архитектуру, которая автоматизирует процесс детекции и сегментации полипов на изображениях колоноскопии. Целью является решение проблем, связанных с недостатком больших данных и сложностями в их аннотации, для повышения точности диагностики. #### Метод Исследование вводит многоаспектную архитектуру для автоматизации детекции и сегментации полипов. Основные компоненты этого подхода: 1. **Синтетическая генерация данных** — используется Stable Diffusion для повышения разнообразия и качества синтетических данных. 2. **Обнаружение полипов** — Faster R-CNN используется для первого локализации объектов, а Segment Anything Model (SAM) создает точные маски сегментации. 3. **Сегментационные модели** — оценивались пять современных сегментационных моделей: U-Net, PSPNet, FPN, LinkNet, MANet, основанные на ResNet34. #### Результаты Эксперименты показали высокую эффективность предложенной системы. Faster R-CNN достиг значений recall 93.08%, precision 88.97% и F1-score 90.98%. Оценка сегментационных моделей демонстрирует следующие результаты: - **FPN** показал наилучшие результаты с PSNR 7.205893 и SSIM 0.492381. - **U-Net** выделился с высоким recall (84.85%) и быстростью обучения. - **LinkNet** показал балансированные результаты с IoU 64.20% и Dice score 77.53%. #### Значимость Предложенная система обладает широкими перспективами в здравоохранении, особенно в сфере колоректального диагностирования. Она может решить проблемы нехватки данных и сложности аннотации, улучшив точность в диагностике и предотвращении колоректального рака. Многоаспектный подход также может быть применен в других областях медицинской интеллектуальной обработки изображений. #### Выводы Представленная работа достигла значительных улучшений в автоматизации детекции и сегментации полипов в колоноскопических изображениях. Основной достигнутый результат — синтез качественных синтетических данных и сравнительная оценка современных сегментационных моделей. Будущие исследования будут фокусироваться на дальнейшем улучшении точности и выносливости системы в разных медицинских приложениях.

Abstract

Colonoscopy is a vital tool for the early diagnosis of colorectal cancer, which is one of the main causes of cancer-related mortality globally; hence, it is deemed an essential technique for the prevention and early detection of colorectal cancer. The research introduces a unique multidirectional architectural framework to automate polyp detection within colonoscopy images while helping resolve limited healthcare dataset sizes and annotation complexities. The research implements a comprehensive system that delivers synthetic data generation through Stable Diffusion enhancements together with detection and segmentation algorithms. This detection approach combines Faster R-CNN for initial object localization while the Segment Anything Model (SAM) refines the segmentation masks. The faster R-CNN detection algorithm achieved a recall of 93.08% combined with a precision of 88.97% and an F1 score of 90.98%.SAM is then used to generate the image mask. The research evaluated five state-of-the-art segmentation models that included U-Net, PSPNet, FPN, LinkNet, and MANet using ResNet34 as a base model. The results demonstrate the superior performance of FPN with the highest scores of PSNR (7.205893) and SSIM (0.492381), while UNet excels in recall (84.85%) and LinkNet shows balanced performance in IoU (64.20%) and Dice score (77.53%).

Ссылки и действия