Latent Interpolation Learning Using Diffusion Models for Cardiac Volume Reconstruction

2508.13826v3 eess.IV, cs.CV 2025-08-22
Авторы:

Niklas Bubeck, Suprosanna Shit, Chen Chen, Can Zhao, Pengfei Guo, Dong Yang, Georg Zitzlsberger, Daguang Xu, Bernhard Kainz, Daniel Rueckert, Jiazhen Pan

Резюме на русском

#### Контекст Кардиаческая магнитно-резонансная (CMR) импедимометрия широко используется для диагностики и контроля за развитием сердечно-сосудистых заболеваний. Однако, эта методика сталкивается с ограничениями, связанными с редким аккумулированием двумерных средне-осевых срезов, что приводит к неполностью информативности в полученных трехмерных моделях. Точное трехмерное восстановление из них является ключевым для получения полного представления о сердце, однако существующие подходы сталкиваются с ограничениями, такими как привязка к стандартным схемам интерполяции (например, линейная или сферическая), высокая вычислительная сложность и необходимость дополнительных семантических данных, таких как разметка сегментации или данные о движении. Таким образом, необходимо разработать эффективный метод, который мог бы улучшить точность трехмерного восстановления и уменьшить компьютерные затраты. #### Метод Мы предлагаем Cardiac Latent Interpolation Diffusion (CaLID), новую архитектуру, основанную на моделях размытия, для решения проблемы восстановления трехмерных структур сердца из двухмерных входных срезов. CaLID включает в себя несколько инновационных элементов. Во-первых, он применяет данно-дренированную интерполяционную схему, которая учитывает нелинейные отношения между двухмерными срезами, и повышает точность восстановления. Во-вторых, мы оптимизировали фреймворк для операций в латентном пространстве, что позволяет уменьшить вычислительные затраты на тридцать раз по сравнению с предыдущими методами. В-третьих, CaLID использует только двухмерные CMR-срезы без дополнительных семантических данных, упрощая процесс и повышая его практичность. Более того, мы расширили CaLID для 2D+T данных, что позволяет моделировать динамику сердца в двух мерном пространстве и времени, обеспечивая корректную спектральную коеффициентную согласованность. #### Результаты Мы проверили CaLID на многочисленных базах данных трехмерных сердечных моделей. Наши эксперименты показали, что метод достигает значительного улучшения в сравнении с другими подходами, как по точности восстановления, так и по вычислительной эффективности. Особое внимание уделено сравнению с базовыми методами, где CaLID показывает существенный превосходственный результат во всем спектре метрик. Также мы проверили то, как работает CaLID на 2D+T данных, и оценили его моделирование трехмерных динамик, указав на достигнутую корректность и когерентность. Эти результаты подтверждают значительные преимущества нашего подхода в области кардиаческой импедимометрии. #### Значимость Предлагаемый подход име

Abstract

Cardiac Magnetic Resonance (CMR) imaging is a critical tool for diagnosing and managing cardiovascular disease, yet its utility is often limited by the sparse acquisition of 2D short-axis slices, resulting in incomplete volumetric information. Accurate 3D reconstruction from these sparse slices is essential for comprehensive cardiac assessment, but existing methods face challenges, including reliance on predefined interpolation schemes (e.g., linear or spherical), computational inefficiency, and dependence on additional semantic inputs such as segmentation labels or motion data. To address these limitations, we propose a novel Cardiac Latent Interpolation Diffusion (CaLID) framework that introduces three key innovations. First, we present a data-driven interpolation scheme based on diffusion models, which can capture complex, non-linear relationships between sparse slices and improves reconstruction accuracy. Second, we design a computationally efficient method that operates in the latent space and speeds up 3D whole-heart upsampling time by a factor of 24, reducing computational overhead compared to previous methods. Third, with only sparse 2D CMR images as input, our method achieves SOTA performance against baseline methods, eliminating the need for auxiliary input such as morphological guidance, thus simplifying workflows. We further extend our method to 2D+T data, enabling the effective modeling of spatiotemporal dynamics and ensuring temporal coherence. Extensive volumetric evaluations and downstream segmentation tasks demonstrate that CaLID achieves superior reconstruction quality and efficiency. By addressing the fundamental limitations of existing approaches, our framework advances the state of the art for spatio and spatiotemporal whole-heart reconstruction, offering a robust and clinically practical solution for cardiovascular imaging.

Ссылки и действия