Diffusion-Based Data Augmentation for Medical Image Segmentation

2508.17844v1 cs.CV, cs.LG 2025-08-27

Авторы:

Maham Nazir, Muhammad Aqeel, Francesco Setti

Резюме на русском

## Контекст В области медицинской информатики становится все более актуальной задача автоматизации сегментации медицинских изображений для обнаружения и исследования различных заболеваний. Одним из основных вызовов в этой области является нехватка больших количеств качественно подготовленных данных, особенно для редких и характеризующихся необычными образованиями. Эта проблема снижает эффективность существующих медицинских моделей сегментации и приводит к ухудшению результатов диагностики. Основная мотивация заключается в развитии методов, позволяющих сгенерировать реалистичные данные для обучения моделей, особенно для редких аномалий, которые требуют точного распознавания и диагностики. ## Метод Предлагаемый подход, DiffAug, заключается в сочетании текстово-управляемого диффузионного подхода с автоматической валидацией сегментации. Основной компонентой этого метода является условное диффузионное моделирование, которое используется для генерации аномалий в медицинских изображениях. Используя текстовые справочные сигналы, полученные из медицинской литературы, а также пространственные маски, DiffAug генерирует реалистичные образцы аномалий, добавляя их на нормальные изображения через процесс inpainting. Для обеспечения высокого качества результатов вводится валидационный механизм, основанный на латентном пространстве, который динамически проверяет сгенерированные образцы на точность и смысловую соответствие. Данный метод оптимизирует процесс генерации и валидации сегментации в одном проходе, что позволяет эффективно использовать ресурсы и повысить точность. ## Результаты На трех медицинских бенчмарках (CVC-ClinicDB, Kvasir-SEG, REFUGE2) проведены эксперименты, демонстрирующие высокую эффективность DiffAug по сравнению с традиционными методами. Модель показала увеличение Dice-метрики на 8-10%, что значительно превосходит существующие алгоритмы. Более того, DiffAug существенно сократил false negative rate на 28%, что является критически важной особенностью для диагностики таких заболеваний, как малые полипы или незначительные поверхностные опухоли. Эти результаты указывают на то, что DiffAug не только улучшает качество сегментации, но и повышает способность моделей распознавать редкие и сложные аномалии. ## Значимость DiffAug может применяться в различных областях, включая раннюю диагностику, медицинские исследования и обучение моделей сегментации. Одним из основных преимуществ является увеличение точности распознавания редких и необычных заболеваний, что имеет практическое значение для раннего выявления и профилактики. Этот подход также обесп

Abstract

Medical image segmentation models struggle with rare abnormalities due to scarce annotated pathological data. We propose DiffAug a novel framework that combines textguided diffusion-based generation with automatic segmentation validation to address this challenge. Our proposed approach uses latent diffusion models conditioned on medical text descriptions and spatial masks to synthesize abnormalities via inpainting on normal images. Generated samples undergo dynamic quality validation through a latentspace segmentation network that ensures accurate localization while enabling single-step inference. The text prompts, derived from medical literature, guide the generation of diverse abnormality types without requiring manual annotation. Our validation mechanism filters synthetic samples based on spatial accuracy, maintaining quality while operating efficiently through direct latent estimation. Evaluated on three medical imaging benchmarks (CVC-ClinicDB, Kvasir-SEG, REFUGE2), our framework achieves state-of-the-art performance with 8-10% Dice improvements over baselines and reduces false negative rates by up to 28% for challenging cases like small polyps and flat lesions critical for early detection in screening applications.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Diffusion-Based Data Augmentation for Medical Image Segmentation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Plug-and-Play Image Restoration with Flow Matching: A Continuous Viewpoint

Inference-time Stochastic Refinement of GRU-Normalizing Flow for Real-time Video...

Rethinking the Use of Vision Transformers for AI-Generated Image Detection

Aligned but Stereotypical? The Hidden Influence of System Prompts on Social Bias...

HTR-ConvText: Leveraging Convolution and Textual Information for Handwritten Tex...

Навигация