Cross-Distribution Diffusion Priors-Driven Iterative Reconstruction for Sparse-View CT

2509.13576v1 eess.IV, cs.CV, 65R32 2025-09-19
Авторы:

Haodong Li, Shuo Han, Haiyang Mao, Yu Shi, Changsheng Fang, Jianjia Zhang, Weiwen Wu, Hengyong Yu

Резюме на русском

## Контекст Хотя спарсе-виев КТ (SVCT) позволяет улучшить терпимость и снизить радиационную дозу, его клиническое применение существенно ограничивается из-за вызванных урезанием количества снимков и изменений в протоколе или анатомии значительных артефактов. Эти проблемы становятся еще более острыми при взаимодействии с данными из других доменов (вне распределения, OOD), что приводит к понижению качества изображений. Необходимость развития методов, обеспечивающих высокое качество изображений при реконструкции SVCT в таких условиях, лежит в основе мотивации для нашего исследования. ## Метод Мы предлагаем Cross-Distribution Diffusion Priors-Driven Iterative Reconstruction (CDPIR) — новую архитектуру, объединяющую модель-основы и методы статистической обработки. Наша методология основывается на развитии Scalable Interpolant Transformer (SiT), расширенной Diffusion Transformer (DiT). Мы используем классер-фри гиданус (Classifier-Free Guidance) для обучения модели SiT, извлекающей общие и доменно-конкретные признаки. Во время тренировки происходит удаление условного ввода с помощью null-embedding, чтобы обеспечить устойчивость модели к изменениям в данных. Во время оптимизации мы используем наборы данных из разных доменов для извлечения признаков, которые позволяют модели работать с OOD-ситуациями. Для реконструкции мы альтернируем между фидбэком данных (дата файдаути) и шагами диффузии, что позволяет модели достигать высокого качества с минимальными ошибками. ## Результаты Мы провести широкий набор экспериментов с использованием множества данных из разных доменов, включая данные с различных сканеров и протоколов. Результаты показывают, что CDPIR существенно превосходит существующие методы в ключевых критериях, таких как PSNR и SSIM, особенно в OOD-сеточках. Мы также проверили устойчивость нашей модели к деформации исходных данных, получив результаты, которые не только выгодно отличаются по доктрине, но и демонстрируют значительное сокращение артефактов, особенно в условиях OOD. ## Значимость CDPIR может быть применен в клинической практике для улучшения качества реконструкции в спарсе-виев CT, особенно в сложных сценариях OOD. Наша модель обеспечивает более точное восстановление деталей и снижение артефактов, что может сделать SVCT более доступным для широкого клинического применения. Эта разработка также показывает потенциал для перекрестных применений в других областях, где необходимо улучшение качества данных с помощью глубоких статистических методов. ## Выводы Мы представляем Cross-Distribution Diffusion Priors-Driven Iterative Reconstruction (CDPIR), новую модель для решения проблем OOD в спарсе-виев CT. Наши результаты показывают, что CDPIR значительно превосходит существующие методы, обеспечивая высокое качест

Abstract

Sparse-View CT (SVCT) reconstruction enhances temporal resolution and reduces radiation dose, yet its clinical use is hindered by artifacts due to view reduction and domain shifts from scanner, protocol, or anatomical variations, leading to performance degradation in out-of-distribution (OOD) scenarios. In this work, we propose a Cross-Distribution Diffusion Priors-Driven Iterative Reconstruction (CDPIR) framework to tackle the OOD problem in SVCT. CDPIR integrates cross-distribution diffusion priors, derived from a Scalable Interpolant Transformer (SiT), with model-based iterative reconstruction methods. Specifically, we train a SiT backbone, an extension of the Diffusion Transformer (DiT) architecture, to establish a unified stochastic interpolant framework, leveraging Classifier-Free Guidance (CFG) across multiple datasets. By randomly dropping the conditioning with a null embedding during training, the model learns both domain-specific and domain-invariant priors, enhancing generalizability. During sampling, the globally sensitive transformer-based diffusion model exploits the cross-distribution prior within the unified stochastic interpolant framework, enabling flexible and stable control over multi-distribution-to-noise interpolation paths and decoupled sampling strategies, thereby improving adaptation to OOD reconstruction. By alternating between data fidelity and sampling updates, our model achieves state-of-the-art performance with superior detail preservation in SVCT reconstructions. Extensive experiments demonstrate that CDPIR significantly outperforms existing approaches, particularly under OOD conditions, highlighting its robustness and potential clinical value in challenging imaging scenarios.

Ссылки и действия