Explainable Knowledge Distillation for Efficient Medical Image Classification

2508.15251v1 eess.IV, cs.AI, cs.CV 2025-08-23
Авторы:

Aqib Nazir Mir, Danish Raza Rizvi

Резюме на русском

## Контекст Область исследования — развитие эффективных инструментов для классификации медицинских изображений, особенно в контексте COVID-19 и рака лёгких. Существуют проблемы, связанные с требованием высокой точности, низким потреблением ресурсов и транспарентностью решений. Наиболее эффективные модели часто требуют больших вычислительных ресурсов, что становится проблемой в клинических условиях. Поэтому, необходима разработка моделей, которые сочетают высокую точность, эффективность и интерпретируемость. Мотивация состоит в разработке систем, которые обладают высоким производительностью и объяснимостью, чтобы обеспечить надежные и практичные решения в области медицинского ИИ. ## Метод Метод заключается в использовании гибридной супервайзед дистилляции для обучения компактной студентской модели на базе ОFA-595 супернета. Работа использует высококачественные теачер-модели, включая VGG19 и лёгкие сети Vision Transformers (Visformer-S и AutoFormer-V2-T). Для обучения используется обобщённая супервайзед дистилляция с использованием граунд-трут етикетов и выходов теачер-моделей в виде мягких целей. Эта модель обучается на двух бенчмарк-датасетах: COVID-QU-Ex и LCS25000. Для визуальной интерпретированности результатов применяется Score-CAM, которая позволяет проанализировать причины прогнозных решений. Методика целью имеет повышение эффективности и доступности решений для клинических применений. ## Результаты Результатами являются наблюдаемые показатели точности, потребление ресурсов и объяснимость моделей. Эксперименты показали, что студентская модель, обученная с помощью дистилляции, сохраняет высокую точность в классификации, в то же время существенно сокращая количество параметров и время инференса. Эти результаты подтверждают эффективность дистилляционного подхода в решении задач классификации медицинских изображений на ресурсоричных устройствах. Данные результаты были получены на двух датасетах COVID-QU-Ex и LCS25000, охватывающих классы COVID-19, здоровый, неCOVID-пневмония, легкие и колонок. Также, проведены визуальные визуализации при помощи Score-CAM, которые позволяют раскрыть причины прогнозов моделей. ## Значимость Результаты имеют значимость в области медицинского ИИ, где эффективность и транспарентность критично важны. Эта модель может быть применена для классификации легких заболеваний, в том числе COVID-19 и рака лёгких, в ресурсозависимых условиях. Улучшенная производительность и снижение потребления ресурсов делают модель привлекательной для кли

Abstract

This study comprehensively explores knowledge distillation frameworks for COVID-19 and lung cancer classification using chest X-ray (CXR) images. We employ high-capacity teacher models, including VGG19 and lightweight Vision Transformers (Visformer-S and AutoFormer-V2-T), to guide the training of a compact, hardware-aware student model derived from the OFA-595 supernet. Our approach leverages hybrid supervision, combining ground-truth labels with teacher models' soft targets to balance accuracy and computational efficiency. We validate our models on two benchmark datasets: COVID-QU-Ex and LCS25000, covering multiple classes, including COVID-19, healthy, non-COVID pneumonia, lung, and colon cancer. To interpret the spatial focus of the models, we employ Score-CAM-based visualizations, which provide insight into the reasoning process of both teacher and student networks. The results demonstrate that the distilled student model maintains high classification performance with significantly reduced parameters and inference time, making it an optimal choice in resource-constrained clinical environments. Our work underscores the importance of combining model efficiency with explainability for practical, trustworthy medical AI solutions.

Ссылки и действия