CT-GRAPH: Hierarchical Graph Attention Network for Anatomy-Guided CT Report Generation
2508.05375v1
cs.CV
2025-08-09
Авторы:
Hamza Kalisch, Fabian Hörst, Jens Kleesiek, Ken Herrmann, Constantin Seibold
Резюме на русском
Автоматизация генерации радиологических отчетов становится ключевым инструментом для облегчения больших нагрузок на радиологов. Несмотря на то, что существующие методы используют глобальные изображения для вывода, они часто пропускают тонкие связи между органами, которые критичны для точности отчетов. Мы предлагаем CT-GRAPH, инновационную архитектуру на основе графа с ато attention, которая акцентирует внимание на фине-грейнной структуре органов и их связях с более общими анатомическими системами. Метод строится на предобученных медицинских 3D-решетках, объединяя локальные и глобальные особенности в графическую модель, которая далее интегрируется с технологией генерации текста. На большой выборке CT-RATE показана улучшение F1-меры на 7.9% по сравнению с состоянием технологии. Это демонстрирует значительный потенциал CT-GRAPH в создании точных и комплексных радиологических отчетов. Исходный код доступен на GitHub.
Abstract
As medical imaging is central to diagnostic processes, automating the
generation of radiology reports has become increasingly relevant to assist
radiologists with their heavy workloads. Most current methods rely solely on
global image features, failing to capture fine-grained organ relationships
crucial for accurate reporting. To this end, we propose CT-GRAPH, a
hierarchical graph attention network that explicitly models radiological
knowledge by structuring anatomical regions into a graph, linking fine-grained
organ features to coarser anatomical systems and a global patient context. Our
method leverages pretrained 3D medical feature encoders to obtain global and
organ-level features by utilizing anatomical masks. These features are further
refined within the graph and then integrated into a large language model to
generate detailed medical reports. We evaluate our approach for the task of
report generation on the large-scale chest CT dataset CT-RATE. We provide an
in-depth analysis of pretrained feature encoders for CT report generation and
show that our method achieves a substantial improvement of absolute 7.9\% in F1
score over current state-of-the-art methods. The code is publicly available at
https://github.com/hakal104/CT-GRAPH.
Ссылки и действия
Дополнительные ресурсы: