Benchmarking Class Activation Map Methods for Explainable Brain Hemorrhage Classification on Hemorica Dataset

2508.17699v1 cs.CV, q-bio.QM 2025-08-27
Авторы:

Z. Rafati, M. Hoseyni, J. Khoramdel, A. Nikoofard

Резюме на русском

## Контекст Медицинское визуальное образование широко использует глубокие нейросетевые модели для классификации и определения областей интереса в изображениях. Однако, несмотря на высокую точность таких моделей, их результаты часто остаются непонятными для клинических специалистов, что снижает доверие к искусственному интеллекту. Эксплайнэйбл AI (XAI) целиком и полностью нацелен на решение этой проблемы, предоставляя возможность к исследованию и пониманию работы моделей. В частности, в области диагностики различных заболеваний, таких как головные травмы и головные травмы, значимость XAI заключается в том, чтобы обеспечить большую транспарентность и доверие к результатам. Одна из таких технологий, Class Activation Mapping (CAM), адресует эту проблему, предоставляя возможность визуального отображения областей входных данных, которые были ключевыми для принятия решения модели. Наша исследовательская группа вносит свой вклад в этот направленный филд, фокусируясь на головных травмах и используя набор данных Hemorica, которой предоставляет обширные маски сегментации и лейблы на уровне пикселей. ## Метод В нашем исследовании мы разработали методологию, основанную на Class Activation Mapping (CAM), чтобы изучить ее взаимосвязь с классификацией головных травм. Мы использовали девять современных алгоритмов CAM, включая Grad-CAM, Grad-CAM++, Score-CAM, Eigen-CAM, Ablation-CAM и HiRes-CAM. Эти алгоритмы были применены к нескольким стадиям нейросетевого анализатора EfficientNetV2S, чтобы извлечь пиксель-уровневые сегментационные и детекционные аннотации. Для каждого алгоритма мы измеряли три основных метрики: Dice, IoU (Intersection over Union) и точность пикселя. Данные, использованные в экспериментах, были получены из Hemorica dataset, который предоставляет как лейблы на уровне срезов, так и высококачественные маски сегментации. Мы также проводили эксперименты, чтобы оценить качество каждого CAM-алгоритма в зависимости от различных стадий модели EfficientNetV2S. ## Результаты Наши эксперименты показали, что на 5-й стадии модели EfficientNetV2S было получено наилучшее локализационное качество. Алгоритм HiRes-CAM достиг самого высокого значения IoU (0.71), в то время как Ablation-CAM показал наилучшую точность на уровне пикселей (Dice = 0.57, IoU = 0.40). Эти результаты были получены несмотря на то, что модели были обучены только для классификации, без дополнительной супервайзированной сегментации. Это указывает на сильное потенциал CAM-техник для обеспечения транспарентности в диагностике головных травм и подтверждает их значимость в XAI-ориентированных подходах для клинических применений. ## Значимость Наше ис

Abstract

Explainable Artificial Intelligence (XAI) has become an essential component of medical imaging research, aiming to increase transparency and clinical trust in deep learning models. This study investigates brain hemorrhage diagnosis with a focus on explainability through Class Activation Mapping (CAM) techniques. A pipeline was developed to extract pixellevel segmentation and detection annotations from classification models using nine state-of-the-art CAM algorithms, applied across multiple network stages, and quantitatively evaluated on the Hemorica dataset, which uniquely provides both slice-level labels and high-quality segmentation masks. Metrics including Dice, IoU, and pixel-wise overlap were employed to benchmark CAM variants. Results show that the strongest localization performance occurred at stage 5 of EfficientNetV2S, with HiResCAM yielding the highest bounding-box alignment and AblationCAM achieving the best pixel-level Dice (0.57) and IoU (0.40), representing strong accuracy given that models were trained solely for classification without segmentation supervision. To the best of current knowledge, this is among the f irst works to quantitatively compare CAM methods for brain hemorrhage detection, establishing a reproducible benchmark and underscoring the potential of XAI-driven pipelines for clinically meaningful AI-assisted diagnosis.

Ссылки и действия