MedicalPatchNet: A Patch-Based Self-Explainable AI Architecture for Chest X-ray Classification

2509.07477v1 cs.CV, cs.LG 2025-09-11
Авторы:

Patrick Wienholt, Christiane Kuhl, Jakob Nikolas Kather, Sven Nebelung, Daniel Truhn

Резюме на русском

## Контекст Диагностическая радиология становится все более зависимость от искусственного интеллекта (ИИ), но существуют значительные проблемы с интерпретируемостью нейронных сетей. Особенно это актуально в области классификации больничных пластин (Chest X-rays), где необходимо определять и выявлять различные заболевания. Несоответствие между высокой точностью и надежной интерпретаторностью традиционных моделей препятствует их клиническому применению. Мотивацией для разработки MedicalPatchNet является необходимость в модели, которая не только будет доступна в клинической практике, но и обеспечит транспарентные и доступные для понимания выводы в реальном времени. ## Метод MedicalPatchNet — это архитектура, основанная на патчах, с самообъясняемым подходом к классификации больничных пластин. Она разбивает изображение на непересекающиеся патчи и использует отдельные нейронные сети для классификации каждого отдельного патча. Затем модель агрегирует выводы отдельных патчей в общий вывод. Это позволяет транспарентно визуализировать вклад каждого патча в общий диагностический процесс. Модель обучается на CheXpert — большом датасете, содержащем 223,414 изображений. Она использует архитектуру EfficientNet-B0 для решения задачи классификации и добавляет возможность самообъяснения в базовую модель. ## Результаты В тестировании, проведенном на CheXpert, MedicalPatchNet показала точность, аналогичную EfficientNet-B0 (AUROC 0.907 vs. 0.908), но обеспечила значительно лучшую интерпретируемость. Модель достигла высокой точности локализации заболеваний (mean hit-rate 0.485) на CheXlocalize, что значительно превосходит Grad-CAM (0.376). Эта улучшенная интерпретаторность позволяет достичь четкого понимания, как каждый патч вкладывается в классификацию изображения. ## Значимость MedicalPatchNet может применяться в различных областях медицинских изображений, где необходимо обеспечить высокую точность, но также требуется прозрачность в диагностических выводах. Особенно она может снизить риски, связанные с shortcut learning, улучшив доверие к нейронным сетям в клинической практике. Это модель с открытым кодом, полностью доступна для обучения и проверки в реальном времени, что делает ее привлекательной для разработчиков и клинических практиков. ## Выводы MedicalPatchNet представляет собой перспективную модель для самообъясняемого ИИ в диагностике, обеспечивая визуально понятные и достоверные выводы для клинического применения. Будущие исследования будут направлены на дальнейшее улучшение точности и применение модели к другим медицинским изображениям, чтобы расширить ее возможности и помочь в

Abstract

Deep neural networks excel in radiological image classification but frequently suffer from poor interpretability, limiting clinical acceptance. We present MedicalPatchNet, an inherently self-explainable architecture for chest X-ray classification that transparently attributes decisions to distinct image regions. MedicalPatchNet splits images into non-overlapping patches, independently classifies each patch, and aggregates predictions, enabling intuitive visualization of each patch's diagnostic contribution without post-hoc techniques. Trained on the CheXpert dataset (223,414 images), MedicalPatchNet matches the classification performance (AUROC 0.907 vs. 0.908) of EfficientNet-B0, while substantially improving interpretability: MedicalPatchNet demonstrates substantially improved interpretability with higher pathology localization accuracy (mean hit-rate 0.485 vs. 0.376 with Grad-CAM) on the CheXlocalize dataset. By providing explicit, reliable explanations accessible even to non-AI experts, MedicalPatchNet mitigates risks associated with shortcut learning, thus improving clinical trust. Our model is publicly available with reproducible training and inference scripts and contributes to safer, explainable AI-assisted diagnostics across medical imaging domains. We make the code publicly available: https://github.com/TruhnLab/MedicalPatchNet

Ссылки и действия