An Efficient Medical Image Classification Method Based on a Lightweight Improved ConvNeXt-Tiny Architecture

2508.11532v1 cs.CV, cs.LG 2025-08-19
Авторы:

Jingsong Xia, Yue Yin, Xiuhan Li

Резюме на русском

## Контекст Интеллектуальный анализ медицинских изображений является ключевым элементом помощи в клинической диагностике. Однако достижение высокой точности и эффективности классификации медицинских изображений в условиях ограниченных вычислительных ресурсов остается значительной проблемой. Традиционные архитектуры моделей часто требуют больших вычислительных ресурсов, что приводит к снижению эффективности их использования в реальном времени. В этом контексте важно разработать метод, который обеспечивает высокую точность классификации и эффективность в ресурсозависимых средах. ## Метод Предложенный метод основывается на улучшенной архитектуре ConvNeXt-Tiny, которая была значительно оптимизирована для решения задачи классификации медицинских изображений. Метод включает в себя несколько основных компонентов: 1. **Улучшенная структура:** Для улучшения возможностей выделения признаков в ConvNeXt-Tiny была введена стратегия фу mergersion с использованием **Global Average Pooling** и **Global Max Pooling**. Эти две методы позволяют сохранить глобальные статистические признаки и острые ответы. 2. **Легковесный модуль Attention:** Был разработан модуль Squeeze-and-Excitation Vector (SEVector), который позволяет адаптивно настраивать веса каналов, уменьшая при этом объем параметров. 3. **Feature Smoothing Loss:** Для повышения точности классификации и сохранения консистентности признаков в пределах класса была добавлена особая потеря Feature Smoothing Loss. Эти изменения были выполнены с целью оптимизировать вычислительные затраты и повысить точность классификации в условиях ограниченных ресурсов. ## Результаты Проведенные эксперименты показали, что предложенный метод достигает высокой точности классификации в условиях ограниченных вычислительных ресурсов. На CPU с 8 потоками и 10 эпохах обучения, модель достигла максимальной точности 89.10%, с очень стабильным убыванием функции потерь. Эти результаты указывают на эффективность разработанного подхода в сочетании с оптимизированной архитектурой ConvNeXt-Tiny. ## Значимость Предложенный подход может быть применен в следующих областях: - **Клиническая диагностика:** Эффективная классификация медицинских изображений может облегчить работу врачей, ускорив процесс диагностики. - **Удаленная диагностика:** Применение в удаленных средях с ограниченными ресурсами, например, в медицинских центрах с недостаточным вычислительным оборудованием. - **Мобильное приложение:** Модель может быть использована в мобильных приложениях для быстрого анализа изображений. Значимыми преимуществами этого подхода являются: - Улучшенная точность классификации. -

Abstract

Intelligent analysis of medical imaging plays a crucial role in assisting clinical diagnosis. However, achieving efficient and high-accuracy image classification in resource-constrained computational environments remains challenging. This study proposes a medical image classification method based on an improved ConvNeXt-Tiny architecture. Through structural optimization and loss function design, the proposed method enhances feature extraction capability and classification performance while reducing computational complexity. Specifically, the method introduces a dual global pooling (Global Average Pooling and Global Max Pooling) feature fusion strategy into the ConvNeXt-Tiny backbone to simultaneously preserve global statistical features and salient response information. A lightweight channel attention module, termed Squeeze-and-Excitation Vector (SEVector), is designed to improve the adaptive allocation of channel weights while minimizing parameter overhead. Additionally, a Feature Smoothing Loss is incorporated into the loss function to enhance intra-class feature consistency and suppress intra-class variance. Under CPU-only conditions (8 threads), the method achieves a maximum classification accuracy of 89.10% on the test set within 10 training epochs, exhibiting a stable convergence trend in loss values. Experimental results demonstrate that the proposed method effectively improves medical image classification performance in resource-limited settings, providing a feasible and efficient solution for the deployment and promotion of medical imaging analysis models.

Ссылки и действия