Latent Interpolation Learning Using Diffusion Models for Cardiac Volume Reconstruction
2508.13826v2
eess.IV, cs.CV
2025-08-21
Авторы:
Niklas Bubeck, Suprosanna Shit, Chen Chen, Can Zhao, Pengfei Guo, Dong Yang, Georg Zitzlsberger, Daguang Xu, Bernhard Kainz, Daniel Rueckert, Jiazhen Pan
Резюме на русском
#### Контекст
Cardiac Magnetic Resonance (CMR) изображения являются критически важным инструментом для диагностики и управления сердечно-сосудистыми заболеваниями. Однако, их эффективность ограничена недостаточной частотой съемки 2D кроп-кусочков синусуса, что приводит к неполной воспроизводимости трехмерной структуры. Эффективная трехмерная реконструкция из таких неполных данных является ключевым заданием для полноценного сердечного анализа, но существующие методы сталкиваются с проблемами. Они часто зависят от предопределенных схем интерполяции (например, линейной или круговой), имеют высокую вычислительную сложность и требуют дополнительных семантических входных данных, таких как сегментационные метки или данные морфологического признака. Из-за этого, необходимо разработать более гибкий и эффективный подход.
#### Метод
Мы предлагаем \textbf{Ca}rdiac \textbf{L}atent \textbf{I}nterpolation \textbf{D}iffusion (CaLID), новую архитектуру на основе моделей размытия, для решения этой проблемы. Наш фреймворк включает три основных инновации. Во-первых, мы предлагаем данно-дреножный способ интерполяции, основанный на моделях размытия, который более точно построит сложные, нелинейные отношения между 2D-кадрами. Во-вторых, мы оптимизировали эту модель для работы в латентном пространстве, чтобы увеличить скорость 3D-реконструкции в 24 раза по сравнению с предыдущими методами. В-третьих, CaLID работает только с неполными 2D-изображениями CMR, не требуя дополнительных семантических меток или данных движения, что упрощает процесс. Для рендеринга всего сердца, мы также расширили нашу модель для работы с 2D+T данными, чтобы гарантировать гармоническую спектро-временную координату.
#### Результаты
Мы провели обширные испытания на большом наборе данных, включающих как стандартные трехмерные реконструкции, так и задачи сегментации. Наши результаты показали, что CaLID превосходит существующие методы, демонстрируя высокую точность и эффективность. Наши трехмерные реконструкции имели меньшую погрешность и высокую разрешающую способность в сравнении с другими способами. Также, мы продемонстрировали, что технология CaLID может быстро перейти от 2D-изображений к 3D-реконструкции, что делает ее клинически затратной и быстрой для сердечных имплантаций.
#### Значимость
Мы видим применение нашего подхода в различных клинических сценариях, включая диагностику и мониторинг сердечных заболеваний, а также для планирования и оптимизации транскордиальных сердечных хирургических вмешательств. Наш фреймворк отличается своей высокой эффек
Abstract
Cardiac Magnetic Resonance (CMR) imaging is a critical tool for diagnosing
and managing cardiovascular disease, yet its utility is often limited by the
sparse acquisition of 2D short-axis slices, resulting in incomplete volumetric
information. Accurate 3D reconstruction from these sparse slices is essential
for comprehensive cardiac assessment, but existing methods face challenges,
including reliance on predefined interpolation schemes (e.g., linear or
spherical), computational inefficiency, and dependence on additional semantic
inputs such as segmentation labels or motion data. To address these
limitations, we propose a novel \textbf{Ca}rdiac \textbf{L}atent
\textbf{I}nterpolation \textbf{D}iffusion (CaLID) framework that introduces
three key innovations. First, we present a data-driven interpolation scheme
based on diffusion models, which can capture complex, non-linear relationships
between sparse slices and improves reconstruction accuracy. Second, we design a
computationally efficient method that operates in the latent space and speeds
up 3D whole-heart upsampling time by a factor of 24, reducing computational
overhead compared to previous methods. Third, with only sparse 2D CMR images as
input, our method achieves SOTA performance against baseline methods,
eliminating the need for auxiliary input such as morphological guidance, thus
simplifying workflows. We further extend our method to 2D+T data, enabling the
effective modeling of spatiotemporal dynamics and ensuring temporal coherence.
Extensive volumetric evaluations and downstream segmentation tasks demonstrate
that CaLID achieves superior reconstruction quality and efficiency. By
addressing the fundamental limitations of existing approaches, our framework
advances the state of the art for spatio and spatiotemporal whole-heart
reconstruction, offering a robust and clinically practical solution for
cardiovascular imaging.
Ссылки и действия
Дополнительные ресурсы: