Zero-shot Volumetric CT Super-Resolution using 3D Gaussian Splatting with Upsampled 2D X-ray Projection Priors

2508.15151v1 eess.IV, cs.CV 2025-08-23

Авторы:

Jeonghyun Noh, Hyun-Jic Oh, Byungju Chae, Won-Ki Jeong

Резюме на русском

## Контекст Исследования в области здравоохранения направлены на улучшение качества диагностики и лечения пациентов. Одной из ключевых задач является повышение разрешения методов компьютерной томографии (CT), что позволяет получить более точные и детальные изображения. Однако повышение разрешения часто приводит к увеличению дозы радиации, которая может нанести вред пациенту. Дополнительно, доступность больших тренировочных наборов данных для обучения моделей суперрезолюции ограничена, что затрудняет выполнение параллельного улучшения качества изображений. Разработаны методы, использующие лишь один низкоразрешенный 3D-CT-скан, однако они часто не могут полностью восстановить тонкие анатомические детали. Наша работа направлена на решение этих проблем с помощью инновационного подхода, использующего 2D-X-ray-проекции. ## Метод Мы предлагаем метод Zero-shot 3D CT Super-Resolution, использующий 3D Gaussian Splatting с использованием дополнительных 2D-X-ray проекционных призов. Метод основывается на диффузионной модели, обученной на большом наборе 2D-X-ray-проекций. Для каждой проекции применяется адаптивная стратегия выбора генерируемых данных, что обеспечивает высококвалифицированные 2D-проекции. Эти проекции служат внешними признами для внутреннего 3D-объема с помощью 3D Gaussian Splatting. Для улучшения восстановления высокочастотных структур мы предлагаем алгоритм Negative Alpha Blending (NAB-GS), который допускает отрицательные значения в представлении Гауссовской скопления. Это позволяет модели восстанавливать тонкие анатомические детали с повышенной точностью. ## Результаты Мы проверили нашу модель на двух различных датасетах. Метрики, такие как PSNR, SSIM и LPIPS, показали, что наша модель превосходит существующие методы по качеству восстановления. Также проведено квалитативное сравнение, в котором визуально подтверждено более высокое разрешение и точность восстановления анатомических деталей в сравнении с конкурентными подходами. Эти результаты подтверждают эффективность нашей модели в трудных условиях, когда доступ к высококачественным данным ограничен. ## Значимость Предлагаемый подход может применяться в широком спектре клинических задач, связанных с повышением качества диагностики. Использование лёгких 2D-X-ray проекций в качестве внешних признаков позволяет избежать проблемы нехватки данных для обучения. Этот подход может быть использован для повышения разрешения 3D-CT в ситуациях, когда затраты на дополнительные процедуры радиационной диагностики желательно минимизировать. Мы также отметили, что модель может быть расширена для других задач в области глу

Abstract

Computed tomography (CT) is widely used in clinical diagnosis, but acquiring high-resolution (HR) CT is limited by radiation exposure risks. Deep learning-based super-resolution (SR) methods have been studied to reconstruct HR from low-resolution (LR) inputs. While supervised SR approaches have shown promising results, they require large-scale paired LR-HR volume datasets that are often unavailable. In contrast, zero-shot methods alleviate the need for paired data by using only a single LR input, but typically struggle to recover fine anatomical details due to limited internal information. To overcome these, we propose a novel zero-shot 3D CT SR framework that leverages upsampled 2D X-ray projection priors generated by a diffusion model. Exploiting the abundance of HR 2D X-ray data, we train a diffusion model on large-scale 2D X-ray projection and introduce a per-projection adaptive sampling strategy. It selects the generative process for each projection, thus providing HR projections as strong external priors for 3D CT reconstruction. These projections serve as inputs to 3D Gaussian splatting for reconstructing a 3D CT volume. Furthermore, we propose negative alpha blending (NAB-GS) that allows negative values in Gaussian density representation. NAB-GS enables residual learning between LR and diffusion-based projections, thereby enhancing high-frequency structure reconstruction. Experiments on two datasets show that our method achieves superior quantitative and qualitative results for 3D CT SR.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Zero-shot Volumetric CT Super-Resolution using 3D Gaussian Splatting with Upsampled 2D X-ray Projection Priors

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Disentangling Progress in Medical Image Registration: Beyond Trend-Driven Archit...

ColonAdapter: Geometry Estimation Through Foundation Model Adaptation for Colono...

Content Adaptive Encoding For Interactive Game Streaming

Hard Spatial Gating for Precision-Driven Brain Metastasis Segmentation: Addressi...

Comparing SAM 2 and SAM 3 for Zero-Shot Segmentation of 3D Medical Data

Навигация