Zero-shot Volumetric CT Super-Resolution using 3D Gaussian Splatting with Upsampled 2D X-ray Projection Priors
2508.15151v1
eess.IV, cs.CV
2025-08-23
Авторы:
Jeonghyun Noh, Hyun-Jic Oh, Byungju Chae, Won-Ki Jeong
Резюме на русском
## Контекст
Исследования в области здравоохранения направлены на улучшение качества диагностики и лечения пациентов. Одной из ключевых задач является повышение разрешения методов компьютерной томографии (CT), что позволяет получить более точные и детальные изображения. Однако повышение разрешения часто приводит к увеличению дозы радиации, которая может нанести вред пациенту. Дополнительно, доступность больших тренировочных наборов данных для обучения моделей суперрезолюции ограничена, что затрудняет выполнение параллельного улучшения качества изображений. Разработаны методы, использующие лишь один низкоразрешенный 3D-CT-скан, однако они часто не могут полностью восстановить тонкие анатомические детали. Наша работа направлена на решение этих проблем с помощью инновационного подхода, использующего 2D-X-ray-проекции.
## Метод
Мы предлагаем метод Zero-shot 3D CT Super-Resolution, использующий 3D Gaussian Splatting с использованием дополнительных 2D-X-ray проекционных призов. Метод основывается на диффузионной модели, обученной на большом наборе 2D-X-ray-проекций. Для каждой проекции применяется адаптивная стратегия выбора генерируемых данных, что обеспечивает высококвалифицированные 2D-проекции. Эти проекции служат внешними признами для внутреннего 3D-объема с помощью 3D Gaussian Splatting. Для улучшения восстановления высокочастотных структур мы предлагаем алгоритм Negative Alpha Blending (NAB-GS), который допускает отрицательные значения в представлении Гауссовской скопления. Это позволяет модели восстанавливать тонкие анатомические детали с повышенной точностью.
## Результаты
Мы проверили нашу модель на двух различных датасетах. Метрики, такие как PSNR, SSIM и LPIPS, показали, что наша модель превосходит существующие методы по качеству восстановления. Также проведено квалитативное сравнение, в котором визуально подтверждено более высокое разрешение и точность восстановления анатомических деталей в сравнении с конкурентными подходами. Эти результаты подтверждают эффективность нашей модели в трудных условиях, когда доступ к высококачественным данным ограничен.
## Значимость
Предлагаемый подход может применяться в широком спектре клинических задач, связанных с повышением качества диагностики. Использование лёгких 2D-X-ray проекций в качестве внешних признаков позволяет избежать проблемы нехватки данных для обучения. Этот подход может быть использован для повышения разрешения 3D-CT в ситуациях, когда затраты на дополнительные процедуры радиационной диагностики желательно минимизировать. Мы также отметили, что модель может быть расширена для других задач в области глу
Abstract
Computed tomography (CT) is widely used in clinical diagnosis, but acquiring
high-resolution (HR) CT is limited by radiation exposure risks. Deep
learning-based super-resolution (SR) methods have been studied to reconstruct
HR from low-resolution (LR) inputs. While supervised SR approaches have shown
promising results, they require large-scale paired LR-HR volume datasets that
are often unavailable. In contrast, zero-shot methods alleviate the need for
paired data by using only a single LR input, but typically struggle to recover
fine anatomical details due to limited internal information. To overcome these,
we propose a novel zero-shot 3D CT SR framework that leverages upsampled 2D
X-ray projection priors generated by a diffusion model. Exploiting the
abundance of HR 2D X-ray data, we train a diffusion model on large-scale 2D
X-ray projection and introduce a per-projection adaptive sampling strategy. It
selects the generative process for each projection, thus providing HR
projections as strong external priors for 3D CT reconstruction. These
projections serve as inputs to 3D Gaussian splatting for reconstructing a 3D CT
volume. Furthermore, we propose negative alpha blending (NAB-GS) that allows
negative values in Gaussian density representation. NAB-GS enables residual
learning between LR and diffusion-based projections, thereby enhancing
high-frequency structure reconstruction. Experiments on two datasets show that
our method achieves superior quantitative and qualitative results for 3D CT SR.
Ссылки и действия
Дополнительные ресурсы: