Enhancing Corpus Callosum Segmentation in Fetal MRI via Pathology-Informed Domain Randomization
2508.20475v1
cs.CV, cs.LG
2025-08-29
Авторы:
Marina Grifell i Plana, Vladyslav Zalevskyi, Léa Schmidt, Yvan Gomez, Thomas Sanchez, Vincent Dunet, Mériam Koob, Vanessa Siffredi, Meritxell Bach Cuadra
Резюме на русском
#### Контекст
Корпус связного (corpus callosum, CC) — крупнейшая нить нейронов, соединяющая левый и правый лобы мозга. Его развитие и функционирование являются ключевыми показателями развития мозга. Особенно важно их оценивать при расстройствах мозгового развития, таких как corpus callosum dysgenesis (CCD), которые могут привести к существенным изменениям анатомии. Однако данных для обучения моделей, специально настроенных на CCD, недостаточно. Такая нехватка данных ограничивает модели, снижает их общеутверждающую способность и последнему этапу процесса — сегментации и измерению биомаркеров CC. Мы предлагаем новую методологию, которая интегрирует представления о CCD в генерацию синтетических данных, чтобы обучать модели в условиях нехватки данных.
#### Метод
Мы предложили метод, основанный на путиологически специфических преобразованиях, для синтеза синтетических данных. Мы использовали знания об изменениях анатомии в CCD для модификации синтетических моделей развития мозга. Это позволяет генерировать разнообразные сценарии, включая CCD-типы, используя только здоровые данные. Метод состоит из двух основных этапов:
1. **Путиологическая трансформация**: Мы используем представления поражений, чтобы синтезировать изображения, включающие различные CCD-типы.
2. **Domain Randomization**: Мы рандомизируем генерируемые сценарии, чтобы увеличить их разнообразие и уменьшить вероятность переобучения.
Модели обучаются на этих синтетических данных и тестируются на реальных данных, чтобы оценивать их точность и универсальность.
#### Результаты
Мы проверили наш метод на трех различных наборах данных:
- **Здоровые дети**: 248 сегментированных мозгов.
- **Дети с CCD**: 26 сегментированных мозгов.
- **Дети с другими мозговыми поражениями**: 47 сегментированных мозгов.
Мы измеряли точность сегментации, особенно улучшений для CCD, и измерили клинически важные биомаркеры, такие как длина и объем CC. Наши результаты показывают:
- Улучшение точности сегментации CCD с 10.9 мм до 0.7 мм.
- Уменьшение ошибки измерения длины CC с 1.89 мм до 0.80 мм.
- Улучшение топологической консистенции сегментации.
#### Значимость
Наш метод может применяться в анализе необычных и клинически значимых мозговых расстройств. Он улучшает точность сегментации и измерения биомаркеров, даже при нехватке данных. Это может повлиять на разработку биомаркеров, предсказание мозгового развития и диагностику ранних форм CCD. Метод также может быть использован для других клинических задач, где недостаточно данных.
#### Выводы
Подход, основанный на
Abstract
Accurate fetal brain segmentation is crucial for extracting biomarkers and
assessing neurodevelopment, especially in conditions such as corpus callosum
dysgenesis (CCD), which can induce drastic anatomical changes. However, the
rarity of CCD severely limits annotated data, hindering the generalization of
deep learning models. To address this, we propose a pathology-informed domain
randomization strategy that embeds prior knowledge of CCD manifestations into a
synthetic data generation pipeline. By simulating diverse brain alterations
from healthy data alone, our approach enables robust segmentation without
requiring pathological annotations.
We validate our method on a cohort comprising 248 healthy fetuses, 26 with
CCD, and 47 with other brain pathologies, achieving substantial improvements on
CCD cases while maintaining performance on both healthy fetuses and those with
other pathologies. From the predicted segmentations, we derive clinically
relevant biomarkers, such as corpus callosum length (LCC) and volume, and show
their utility in distinguishing CCD subtypes. Our pathology-informed
augmentation reduces the LCC estimation error from 1.89 mm to 0.80 mm in
healthy cases and from 10.9 mm to 0.7 mm in CCD cases. Beyond these
quantitative gains, our approach yields segmentations with improved topological
consistency relative to available ground truth, enabling more reliable
shape-based analyses. Overall, this work demonstrates that incorporating
domain-specific anatomical priors into synthetic data pipelines can effectively
mitigate data scarcity and enhance analysis of rare but clinically significant
malformations.
Ссылки и действия
Дополнительные ресурсы: