MedicalPatchNet: A Patch-Based Self-Explainable AI Architecture for Chest X-ray Classification
2509.07477v1
cs.CV, cs.LG
2025-09-11
Авторы:
Patrick Wienholt, Christiane Kuhl, Jakob Nikolas Kather, Sven Nebelung, Daniel Truhn
Резюме на русском
## Контекст
Диагностическая радиология становится все более зависимость от искусственного интеллекта (ИИ), но существуют значительные проблемы с интерпретируемостью нейронных сетей. Особенно это актуально в области классификации больничных пластин (Chest X-rays), где необходимо определять и выявлять различные заболевания. Несоответствие между высокой точностью и надежной интерпретаторностью традиционных моделей препятствует их клиническому применению. Мотивацией для разработки MedicalPatchNet является необходимость в модели, которая не только будет доступна в клинической практике, но и обеспечит транспарентные и доступные для понимания выводы в реальном времени.
## Метод
MedicalPatchNet — это архитектура, основанная на патчах, с самообъясняемым подходом к классификации больничных пластин. Она разбивает изображение на непересекающиеся патчи и использует отдельные нейронные сети для классификации каждого отдельного патча. Затем модель агрегирует выводы отдельных патчей в общий вывод. Это позволяет транспарентно визуализировать вклад каждого патча в общий диагностический процесс. Модель обучается на CheXpert — большом датасете, содержащем 223,414 изображений. Она использует архитектуру EfficientNet-B0 для решения задачи классификации и добавляет возможность самообъяснения в базовую модель.
## Результаты
В тестировании, проведенном на CheXpert, MedicalPatchNet показала точность, аналогичную EfficientNet-B0 (AUROC 0.907 vs. 0.908), но обеспечила значительно лучшую интерпретируемость. Модель достигла высокой точности локализации заболеваний (mean hit-rate 0.485) на CheXlocalize, что значительно превосходит Grad-CAM (0.376). Эта улучшенная интерпретаторность позволяет достичь четкого понимания, как каждый патч вкладывается в классификацию изображения.
## Значимость
MedicalPatchNet может применяться в различных областях медицинских изображений, где необходимо обеспечить высокую точность, но также требуется прозрачность в диагностических выводах. Особенно она может снизить риски, связанные с shortcut learning, улучшив доверие к нейронным сетям в клинической практике. Это модель с открытым кодом, полностью доступна для обучения и проверки в реальном времени, что делает ее привлекательной для разработчиков и клинических практиков.
## Выводы
MedicalPatchNet представляет собой перспективную модель для самообъясняемого ИИ в диагностике, обеспечивая визуально понятные и достоверные выводы для клинического применения. Будущие исследования будут направлены на дальнейшее улучшение точности и применение модели к другим медицинским изображениям, чтобы расширить ее возможности и помочь в
Abstract
Deep neural networks excel in radiological image classification but
frequently suffer from poor interpretability, limiting clinical acceptance. We
present MedicalPatchNet, an inherently self-explainable architecture for chest
X-ray classification that transparently attributes decisions to distinct image
regions. MedicalPatchNet splits images into non-overlapping patches,
independently classifies each patch, and aggregates predictions, enabling
intuitive visualization of each patch's diagnostic contribution without
post-hoc techniques. Trained on the CheXpert dataset (223,414 images),
MedicalPatchNet matches the classification performance (AUROC 0.907 vs. 0.908)
of EfficientNet-B0, while substantially improving interpretability:
MedicalPatchNet demonstrates substantially improved interpretability with
higher pathology localization accuracy (mean hit-rate 0.485 vs. 0.376 with
Grad-CAM) on the CheXlocalize dataset. By providing explicit, reliable
explanations accessible even to non-AI experts, MedicalPatchNet mitigates risks
associated with shortcut learning, thus improving clinical trust. Our model is
publicly available with reproducible training and inference scripts and
contributes to safer, explainable AI-assisted diagnostics across medical
imaging domains. We make the code publicly available:
https://github.com/TruhnLab/MedicalPatchNet
Ссылки и действия
Дополнительные ресурсы: