Latent Interpolation Learning Using Diffusion Models for Cardiac Volume Reconstruction
2508.13826v3
eess.IV, cs.CV
2025-08-22
Авторы:
Niklas Bubeck, Suprosanna Shit, Chen Chen, Can Zhao, Pengfei Guo, Dong Yang, Georg Zitzlsberger, Daguang Xu, Bernhard Kainz, Daniel Rueckert, Jiazhen Pan
Резюме на русском
#### Контекст
Кардиаческая магнитно-резонансная (CMR) импедимометрия широко используется для диагностики и контроля за развитием сердечно-сосудистых заболеваний. Однако, эта методика сталкивается с ограничениями, связанными с редким аккумулированием двумерных средне-осевых срезов, что приводит к неполностью информативности в полученных трехмерных моделях. Точное трехмерное восстановление из них является ключевым для получения полного представления о сердце, однако существующие подходы сталкиваются с ограничениями, такими как привязка к стандартным схемам интерполяции (например, линейная или сферическая), высокая вычислительная сложность и необходимость дополнительных семантических данных, таких как разметка сегментации или данные о движении. Таким образом, необходимо разработать эффективный метод, который мог бы улучшить точность трехмерного восстановления и уменьшить компьютерные затраты.
#### Метод
Мы предлагаем Cardiac Latent Interpolation Diffusion (CaLID), новую архитектуру, основанную на моделях размытия, для решения проблемы восстановления трехмерных структур сердца из двухмерных входных срезов. CaLID включает в себя несколько инновационных элементов. Во-первых, он применяет данно-дренированную интерполяционную схему, которая учитывает нелинейные отношения между двухмерными срезами, и повышает точность восстановления. Во-вторых, мы оптимизировали фреймворк для операций в латентном пространстве, что позволяет уменьшить вычислительные затраты на тридцать раз по сравнению с предыдущими методами. В-третьих, CaLID использует только двухмерные CMR-срезы без дополнительных семантических данных, упрощая процесс и повышая его практичность. Более того, мы расширили CaLID для 2D+T данных, что позволяет моделировать динамику сердца в двух мерном пространстве и времени, обеспечивая корректную спектральную коеффициентную согласованность.
#### Результаты
Мы проверили CaLID на многочисленных базах данных трехмерных сердечных моделей. Наши эксперименты показали, что метод достигает значительного улучшения в сравнении с другими подходами, как по точности восстановления, так и по вычислительной эффективности. Особое внимание уделено сравнению с базовыми методами, где CaLID показывает существенный превосходственный результат во всем спектре метрик. Также мы проверили то, как работает CaLID на 2D+T данных, и оценили его моделирование трехмерных динамик, указав на достигнутую корректность и когерентность. Эти результаты подтверждают значительные преимущества нашего подхода в области кардиаческой импедимометрии.
#### Значимость
Предлагаемый подход име
Abstract
Cardiac Magnetic Resonance (CMR) imaging is a critical tool for diagnosing
and managing cardiovascular disease, yet its utility is often limited by the
sparse acquisition of 2D short-axis slices, resulting in incomplete volumetric
information. Accurate 3D reconstruction from these sparse slices is essential
for comprehensive cardiac assessment, but existing methods face challenges,
including reliance on predefined interpolation schemes (e.g., linear or
spherical), computational inefficiency, and dependence on additional semantic
inputs such as segmentation labels or motion data. To address these
limitations, we propose a novel Cardiac Latent Interpolation Diffusion (CaLID)
framework that introduces three key innovations. First, we present a
data-driven interpolation scheme based on diffusion models, which can capture
complex, non-linear relationships between sparse slices and improves
reconstruction accuracy. Second, we design a computationally efficient method
that operates in the latent space and speeds up 3D whole-heart upsampling time
by a factor of 24, reducing computational overhead compared to previous
methods. Third, with only sparse 2D CMR images as input, our method achieves
SOTA performance against baseline methods, eliminating the need for auxiliary
input such as morphological guidance, thus simplifying workflows. We further
extend our method to 2D+T data, enabling the effective modeling of
spatiotemporal dynamics and ensuring temporal coherence. Extensive volumetric
evaluations and downstream segmentation tasks demonstrate that CaLID achieves
superior reconstruction quality and efficiency. By addressing the fundamental
limitations of existing approaches, our framework advances the state of the art
for spatio and spatiotemporal whole-heart reconstruction, offering a robust and
clinically practical solution for cardiovascular imaging.
Ссылки и действия
Дополнительные ресурсы: