Latent Interpolation Learning Using Diffusion Models for Cardiac Volume Reconstruction

2508.13826v2 eess.IV, cs.CV 2025-08-21
Авторы:

Niklas Bubeck, Suprosanna Shit, Chen Chen, Can Zhao, Pengfei Guo, Dong Yang, Georg Zitzlsberger, Daguang Xu, Bernhard Kainz, Daniel Rueckert, Jiazhen Pan

Резюме на русском

#### Контекст Cardiac Magnetic Resonance (CMR) изображения являются критически важным инструментом для диагностики и управления сердечно-сосудистыми заболеваниями. Однако, их эффективность ограничена недостаточной частотой съемки 2D кроп-кусочков синусуса, что приводит к неполной воспроизводимости трехмерной структуры. Эффективная трехмерная реконструкция из таких неполных данных является ключевым заданием для полноценного сердечного анализа, но существующие методы сталкиваются с проблемами. Они часто зависят от предопределенных схем интерполяции (например, линейной или круговой), имеют высокую вычислительную сложность и требуют дополнительных семантических входных данных, таких как сегментационные метки или данные морфологического признака. Из-за этого, необходимо разработать более гибкий и эффективный подход. #### Метод Мы предлагаем \textbf{Ca}rdiac \textbf{L}atent \textbf{I}nterpolation \textbf{D}iffusion (CaLID), новую архитектуру на основе моделей размытия, для решения этой проблемы. Наш фреймворк включает три основных инновации. Во-первых, мы предлагаем данно-дреножный способ интерполяции, основанный на моделях размытия, который более точно построит сложные, нелинейные отношения между 2D-кадрами. Во-вторых, мы оптимизировали эту модель для работы в латентном пространстве, чтобы увеличить скорость 3D-реконструкции в 24 раза по сравнению с предыдущими методами. В-третьих, CaLID работает только с неполными 2D-изображениями CMR, не требуя дополнительных семантических меток или данных движения, что упрощает процесс. Для рендеринга всего сердца, мы также расширили нашу модель для работы с 2D+T данными, чтобы гарантировать гармоническую спектро-временную координату. #### Результаты Мы провели обширные испытания на большом наборе данных, включающих как стандартные трехмерные реконструкции, так и задачи сегментации. Наши результаты показали, что CaLID превосходит существующие методы, демонстрируя высокую точность и эффективность. Наши трехмерные реконструкции имели меньшую погрешность и высокую разрешающую способность в сравнении с другими способами. Также, мы продемонстрировали, что технология CaLID может быстро перейти от 2D-изображений к 3D-реконструкции, что делает ее клинически затратной и быстрой для сердечных имплантаций. #### Значимость Мы видим применение нашего подхода в различных клинических сценариях, включая диагностику и мониторинг сердечных заболеваний, а также для планирования и оптимизации транскордиальных сердечных хирургических вмешательств. Наш фреймворк отличается своей высокой эффек

Abstract

Cardiac Magnetic Resonance (CMR) imaging is a critical tool for diagnosing and managing cardiovascular disease, yet its utility is often limited by the sparse acquisition of 2D short-axis slices, resulting in incomplete volumetric information. Accurate 3D reconstruction from these sparse slices is essential for comprehensive cardiac assessment, but existing methods face challenges, including reliance on predefined interpolation schemes (e.g., linear or spherical), computational inefficiency, and dependence on additional semantic inputs such as segmentation labels or motion data. To address these limitations, we propose a novel \textbf{Ca}rdiac \textbf{L}atent \textbf{I}nterpolation \textbf{D}iffusion (CaLID) framework that introduces three key innovations. First, we present a data-driven interpolation scheme based on diffusion models, which can capture complex, non-linear relationships between sparse slices and improves reconstruction accuracy. Second, we design a computationally efficient method that operates in the latent space and speeds up 3D whole-heart upsampling time by a factor of 24, reducing computational overhead compared to previous methods. Third, with only sparse 2D CMR images as input, our method achieves SOTA performance against baseline methods, eliminating the need for auxiliary input such as morphological guidance, thus simplifying workflows. We further extend our method to 2D+T data, enabling the effective modeling of spatiotemporal dynamics and ensuring temporal coherence. Extensive volumetric evaluations and downstream segmentation tasks demonstrate that CaLID achieves superior reconstruction quality and efficiency. By addressing the fundamental limitations of existing approaches, our framework advances the state of the art for spatio and spatiotemporal whole-heart reconstruction, offering a robust and clinically practical solution for cardiovascular imaging.

Ссылки и действия