Enhancing Corpus Callosum Segmentation in Fetal MRI via Pathology-Informed Domain Randomization

2508.20475v1 cs.CV, cs.LG 2025-08-29
Авторы:

Marina Grifell i Plana, Vladyslav Zalevskyi, Léa Schmidt, Yvan Gomez, Thomas Sanchez, Vincent Dunet, Mériam Koob, Vanessa Siffredi, Meritxell Bach Cuadra

Резюме на русском

#### Контекст Корпус связного (corpus callosum, CC) — крупнейшая нить нейронов, соединяющая левый и правый лобы мозга. Его развитие и функционирование являются ключевыми показателями развития мозга. Особенно важно их оценивать при расстройствах мозгового развития, таких как corpus callosum dysgenesis (CCD), которые могут привести к существенным изменениям анатомии. Однако данных для обучения моделей, специально настроенных на CCD, недостаточно. Такая нехватка данных ограничивает модели, снижает их общеутверждающую способность и последнему этапу процесса — сегментации и измерению биомаркеров CC. Мы предлагаем новую методологию, которая интегрирует представления о CCD в генерацию синтетических данных, чтобы обучать модели в условиях нехватки данных. #### Метод Мы предложили метод, основанный на путиологически специфических преобразованиях, для синтеза синтетических данных. Мы использовали знания об изменениях анатомии в CCD для модификации синтетических моделей развития мозга. Это позволяет генерировать разнообразные сценарии, включая CCD-типы, используя только здоровые данные. Метод состоит из двух основных этапов: 1. **Путиологическая трансформация**: Мы используем представления поражений, чтобы синтезировать изображения, включающие различные CCD-типы. 2. **Domain Randomization**: Мы рандомизируем генерируемые сценарии, чтобы увеличить их разнообразие и уменьшить вероятность переобучения. Модели обучаются на этих синтетических данных и тестируются на реальных данных, чтобы оценивать их точность и универсальность. #### Результаты Мы проверили наш метод на трех различных наборах данных: - **Здоровые дети**: 248 сегментированных мозгов. - **Дети с CCD**: 26 сегментированных мозгов. - **Дети с другими мозговыми поражениями**: 47 сегментированных мозгов. Мы измеряли точность сегментации, особенно улучшений для CCD, и измерили клинически важные биомаркеры, такие как длина и объем CC. Наши результаты показывают: - Улучшение точности сегментации CCD с 10.9 мм до 0.7 мм. - Уменьшение ошибки измерения длины CC с 1.89 мм до 0.80 мм. - Улучшение топологической консистенции сегментации. #### Значимость Наш метод может применяться в анализе необычных и клинически значимых мозговых расстройств. Он улучшает точность сегментации и измерения биомаркеров, даже при нехватке данных. Это может повлиять на разработку биомаркеров, предсказание мозгового развития и диагностику ранних форм CCD. Метод также может быть использован для других клинических задач, где недостаточно данных. #### Выводы Подход, основанный на

Abstract

Accurate fetal brain segmentation is crucial for extracting biomarkers and assessing neurodevelopment, especially in conditions such as corpus callosum dysgenesis (CCD), which can induce drastic anatomical changes. However, the rarity of CCD severely limits annotated data, hindering the generalization of deep learning models. To address this, we propose a pathology-informed domain randomization strategy that embeds prior knowledge of CCD manifestations into a synthetic data generation pipeline. By simulating diverse brain alterations from healthy data alone, our approach enables robust segmentation without requiring pathological annotations. We validate our method on a cohort comprising 248 healthy fetuses, 26 with CCD, and 47 with other brain pathologies, achieving substantial improvements on CCD cases while maintaining performance on both healthy fetuses and those with other pathologies. From the predicted segmentations, we derive clinically relevant biomarkers, such as corpus callosum length (LCC) and volume, and show their utility in distinguishing CCD subtypes. Our pathology-informed augmentation reduces the LCC estimation error from 1.89 mm to 0.80 mm in healthy cases and from 10.9 mm to 0.7 mm in CCD cases. Beyond these quantitative gains, our approach yields segmentations with improved topological consistency relative to available ground truth, enabling more reliable shape-based analyses. Overall, this work demonstrates that incorporating domain-specific anatomical priors into synthetic data pipelines can effectively mitigate data scarcity and enhance analysis of rare but clinically significant malformations.

Ссылки и действия