Deep Learning-Based Cross-Anatomy CT Synthesis Using Adapted nnResU-Net with Anatomical Feature Prioritized Loss

2509.22394v1 eess.IV, cs.AI, cs.CV, I.2; J.3 2025-09-30
Авторы:

Javier Sequeiro González, Arthur Longuefosse, Miguel Díaz Benito, Álvaro García Martín, Fabien Baldacci

Резюме на русском

## Контекст Область исследования, связанная с кросс-анатомической синтезированной системой, позволяет переводить зоны изображений медицинских Томографий (CT и MR) от одной анатомической области (например, головно-шейной) в другую (например, грудно-перитонеальную). Эта задача возникает в ситуациях, когда имеется только одна часть изображений, но возникает необходимость во всемирном изображении. Это приводит к затруднениям в техническом плане, так как медицинские изображения отличаются по характеристикам в разных областях. Кроме того, повышенное значение придается к стабильности и точности реконструкции клинически важных структур. Мотивация построения такой системы заключается в улучшении понимания, контроле и диагностическому точному визуализации через виртуальный перевод медицинских изображений. ## Метод Проект основывается на продвинутой технологии глубокого обучения. Использованная архитектура сети для синтеза изображений — это адаптированный nnResU-Net, который сочетает в себе преимущества стандартной U-Net и резидентного моделирования (ResNet). Для улучшения реконструкции важных анатомических структур введена новая функция ошибки — "Anatomical Feature-Prioritized (AFP) loss". Она работает с несколькими уровнями фичи из сети сегментации TotalSegmentator, что повышает реконструкцию ключевых медицинских областей. Данные были нормализованы для каждого случая, включая методы z-score для MRI, и клиппинг с датасетом-уровнем z-score для CBCT и CT. Обучение проводилось на 3D-патчах, специфичных для каждой анатомической области, без дополнительного увеличения данных. Эталонная точность достигалась через 1000–1500 эпох обучения, а дополнительный последовательный цикл адаптации AFP добавился в течение 500 эпох. Результаты обработки сгруппированы с помощью среднего агрегирования с патчем 0.3, а постобработка включала восстановление оригинальных значений через z-score. ## Результаты Использовались данные из многоцентрового набора SynthRAD2025, который охватывает головно-шейные, грудные и абдоминальные области. Оценка сети проводилась как качественно, так и количественно. Результаты показали, что модель с резидентным обучением и AFP-loss придает более четкие и точные реконструкции, особенно в случаях перевода MR в CT (для костных структур) и CBCT в CT (для образов злокачественных образов). Хотя L1-только модели показали лучшие метрики на основе интенсивности, резидентные модели с AFP-loss давали более надежные результаты в анатомической точности. ## Значимость Разработанная система имеет широкие применения в области медицинской имидж-процессинга, включая вирту

Abstract

We present a patch-based 3D nnUNet adaptation for MR to CT and CBCT to CT image translation using the multicenter SynthRAD2025 dataset, covering head and neck (HN), thorax (TH), and abdomen (AB) regions. Our approach leverages two main network configurations: a standard UNet and a residual UNet, both adapted from nnUNet for image synthesis. The Anatomical Feature-Prioritized (AFP) loss was introduced, which compares multilayer features extracted from a compact segmentation network trained on TotalSegmentator labels, enhancing reconstruction of clinically relevant structures. Input volumes were normalized per-case using zscore normalization for MRIs, and clipping plus dataset level zscore normalization for CBCT and CT. Training used 3D patches tailored to each anatomical region without additional data augmentation. Models were trained for 1000 and 1500 epochs, with AFP fine-tuning performed for 500 epochs using a combined L1+AFP objective. During inference, overlapping patches were aggregated via mean averaging with step size of 0.3, and postprocessing included reverse zscore normalization. Both network configurations were applied across all regions, allowing consistent model design while capturing local adaptations through residual learning and AFP loss. Qualitative and quantitative evaluation revealed that residual networks combined with AFP yielded sharper reconstructions and improved anatomical fidelity, particularly for bone structures in MR to CT and lesions in CBCT to CT, while L1only networks achieved slightly better intensity-based metrics. This methodology provides a stable solution for cross modality medical image synthesis, demonstrating the effectiveness of combining the automatic nnUNet pipeline with residual learning and anatomically guided feature losses.

Ссылки и действия