CT-GRAPH: Hierarchical Graph Attention Network for Anatomy-Guided CT Report Generation

2508.05375v1 cs.CV 2025-08-09
Авторы:

Hamza Kalisch, Fabian Hörst, Jens Kleesiek, Ken Herrmann, Constantin Seibold

Резюме на русском

Автоматизация генерации радиологических отчетов становится ключевым инструментом для облегчения больших нагрузок на радиологов. Несмотря на то, что существующие методы используют глобальные изображения для вывода, они часто пропускают тонкие связи между органами, которые критичны для точности отчетов. Мы предлагаем CT-GRAPH, инновационную архитектуру на основе графа с ато attention, которая акцентирует внимание на фине-грейнной структуре органов и их связях с более общими анатомическими системами. Метод строится на предобученных медицинских 3D-решетках, объединяя локальные и глобальные особенности в графическую модель, которая далее интегрируется с технологией генерации текста. На большой выборке CT-RATE показана улучшение F1-меры на 7.9% по сравнению с состоянием технологии. Это демонстрирует значительный потенциал CT-GRAPH в создании точных и комплексных радиологических отчетов. Исходный код доступен на GitHub.

Abstract

As medical imaging is central to diagnostic processes, automating the generation of radiology reports has become increasingly relevant to assist radiologists with their heavy workloads. Most current methods rely solely on global image features, failing to capture fine-grained organ relationships crucial for accurate reporting. To this end, we propose CT-GRAPH, a hierarchical graph attention network that explicitly models radiological knowledge by structuring anatomical regions into a graph, linking fine-grained organ features to coarser anatomical systems and a global patient context. Our method leverages pretrained 3D medical feature encoders to obtain global and organ-level features by utilizing anatomical masks. These features are further refined within the graph and then integrated into a large language model to generate detailed medical reports. We evaluate our approach for the task of report generation on the large-scale chest CT dataset CT-RATE. We provide an in-depth analysis of pretrained feature encoders for CT report generation and show that our method achieves a substantial improvement of absolute 7.9\% in F1 score over current state-of-the-art methods. The code is publicly available at https://github.com/hakal104/CT-GRAPH.

Ссылки и действия