Diffusion-Based Data Augmentation for Medical Image Segmentation
2508.17844v1
cs.CV, cs.LG
2025-08-27
Авторы:
Maham Nazir, Muhammad Aqeel, Francesco Setti
Резюме на русском
## Контекст
В области медицинской информатики становится все более актуальной задача автоматизации сегментации медицинских изображений для обнаружения и исследования различных заболеваний. Одним из основных вызовов в этой области является нехватка больших количеств качественно подготовленных данных, особенно для редких и характеризующихся необычными образованиями. Эта проблема снижает эффективность существующих медицинских моделей сегментации и приводит к ухудшению результатов диагностики. Основная мотивация заключается в развитии методов, позволяющих сгенерировать реалистичные данные для обучения моделей, особенно для редких аномалий, которые требуют точного распознавания и диагностики.
## Метод
Предлагаемый подход, DiffAug, заключается в сочетании текстово-управляемого диффузионного подхода с автоматической валидацией сегментации. Основной компонентой этого метода является условное диффузионное моделирование, которое используется для генерации аномалий в медицинских изображениях. Используя текстовые справочные сигналы, полученные из медицинской литературы, а также пространственные маски, DiffAug генерирует реалистичные образцы аномалий, добавляя их на нормальные изображения через процесс inpainting. Для обеспечения высокого качества результатов вводится валидационный механизм, основанный на латентном пространстве, который динамически проверяет сгенерированные образцы на точность и смысловую соответствие. Данный метод оптимизирует процесс генерации и валидации сегментации в одном проходе, что позволяет эффективно использовать ресурсы и повысить точность.
## Результаты
На трех медицинских бенчмарках (CVC-ClinicDB, Kvasir-SEG, REFUGE2) проведены эксперименты, демонстрирующие высокую эффективность DiffAug по сравнению с традиционными методами. Модель показала увеличение Dice-метрики на 8-10%, что значительно превосходит существующие алгоритмы. Более того, DiffAug существенно сократил false negative rate на 28%, что является критически важной особенностью для диагностики таких заболеваний, как малые полипы или незначительные поверхностные опухоли. Эти результаты указывают на то, что DiffAug не только улучшает качество сегментации, но и повышает способность моделей распознавать редкие и сложные аномалии.
## Значимость
DiffAug может применяться в различных областях, включая раннюю диагностику, медицинские исследования и обучение моделей сегментации. Одним из основных преимуществ является увеличение точности распознавания редких и необычных заболеваний, что имеет практическое значение для раннего выявления и профилактики. Этот подход также обесп
Abstract
Medical image segmentation models struggle with rare abnormalities due to
scarce annotated pathological data. We propose DiffAug a novel framework that
combines textguided diffusion-based generation with automatic segmentation
validation to address this challenge. Our proposed approach uses latent
diffusion models conditioned on medical text descriptions and spatial masks to
synthesize abnormalities via inpainting on normal images. Generated samples
undergo dynamic quality validation through a latentspace segmentation network
that ensures accurate localization while enabling single-step inference. The
text prompts, derived from medical literature, guide the generation of diverse
abnormality types without requiring manual annotation. Our validation mechanism
filters synthetic samples based on spatial accuracy, maintaining quality while
operating efficiently through direct latent estimation. Evaluated on three
medical imaging benchmarks (CVC-ClinicDB, Kvasir-SEG, REFUGE2), our framework
achieves state-of-the-art performance with 8-10% Dice improvements over
baselines and reduces false negative rates by up to 28% for challenging cases
like small polyps and flat lesions critical for early detection in screening
applications.
Ссылки и действия
Дополнительные ресурсы: