Anatomy-Aware Low-Dose CT Denoising via Pretrained Vision Models and Semantic-Guided Contrastive Learning

2508.07788v1 eess.IV, cs.CV 2025-08-13
Авторы:

Runze Wang, Zeli Chen, Zhiyun Song, Wei Fang, Jiajin Zhang, Danyang Tu, Yuxing Tang, Minfeng Xu, Xianghua Ye, Le Lu, Dakai Jin

Резюме на русском

## Контекст Задача понижения дозы в компьютерной томографии (LDCT) широко используется для снижения радиационного воздействия при диагностике, однако это приводит к появлению шума и искажений в изображениях. Несмотря на развитие нейронных сетей для решения этой проблемы, большинство методов не учитывают анатомические особенности тканей, что приводит к неудовлетворительным результатам. Мотивация для разработки новых подходов заключается в том, чтобы сочетать анатомические семантические признаки с глубокими аналитическими моделями для повышения точности и качества диагностических изображений. ## Метод Метод ALDEN (Anatomy-aware LDCT Denoising) использует взаимодействие семантических признаков с pretrained vision models (PVMs) и адверсарным, а также контрастным обучением. Основной инновацией является анатомический дискриминатор, который основывается на кросс-аттенции для оценки реализма тканей в реальных изображениях. Дополнительно, введен модуль семантического гидровоздушного струйного баллистического контроля, который сохраняет анатомическую консистенцию путем сравнения признаков PVM для LDCT, denoised CT и NDCT. Это позволяет сохранять тканевые характеристики тела и избавляться от артефактов. ## Результаты Установленные эксперименты проводились на двух LDCT-данных. Результаты показали, что ALDEN превосходит существующие методы по метрикам качества изображений и сохранению анатомических структур. Особо выделяется повышение реализма изображений и уменьшение овер-сглаживания, которое характеризуется методами с предыдущими подходами. Задача многоорганной сегментации (117 структур) подтвердила дополнительную выгоду модели в сохранении анатомических особенностей. ## Значимость Подход ALDEN применим в области диагностики и визуализации медицинских изображений, где требуется высокое качество и анатомическая точность. Избавление от шума и артефактов, в сочетании с сохранением контекста тканей, обеспечивает лучший диагностический потенциал. Этот метод может положительно сказаться на раннем выявлении заболеваний и повышении достоверности диагноза в различных медицинских условиях. ## Выводы Результаты ALDEN указывают на возможность сочетать анатомические семантические признаки с глубокими моделями для подготовки изображений LDCT. Будущие исследования будут направлены на улучшение модели для более широкого выполнения задач в области медицинских изображений и глубокого обучения.

Abstract

To reduce radiation exposure and improve the diagnostic efficacy of low-dose computed tomography (LDCT), numerous deep learning-based denoising methods have been developed to mitigate noise and artifacts. However, most of these approaches ignore the anatomical semantics of human tissues, which may potentially result in suboptimal denoising outcomes. To address this problem, we propose ALDEN, an anatomy-aware LDCT denoising method that integrates semantic features of pretrained vision models (PVMs) with adversarial and contrastive learning. Specifically, we introduce an anatomy-aware discriminator that dynamically fuses hierarchical semantic features from reference normal-dose CT (NDCT) via cross-attention mechanisms, enabling tissue-specific realism evaluation in the discriminator. In addition, we propose a semantic-guided contrastive learning module that enforces anatomical consistency by contrasting PVM-derived features from LDCT, denoised CT and NDCT, preserving tissue-specific patterns through positive pairs and suppressing artifacts via dual negative pairs. Extensive experiments conducted on two LDCT denoising datasets reveal that ALDEN achieves the state-of-the-art performance, offering superior anatomy preservation and substantially reducing over-smoothing issue of previous work. Further validation on a downstream multi-organ segmentation task (encompassing 117 anatomical structures) affirms the model's ability to maintain anatomical awareness.

Ссылки и действия