An Efficient Medical Image Classification Method Based on a Lightweight Improved ConvNeXt-Tiny Architecture
2508.11532v1
cs.CV, cs.LG
2025-08-19
Авторы:
Jingsong Xia, Yue Yin, Xiuhan Li
Резюме на русском
## Контекст
Интеллектуальный анализ медицинских изображений является ключевым элементом помощи в клинической диагностике. Однако достижение высокой точности и эффективности классификации медицинских изображений в условиях ограниченных вычислительных ресурсов остается значительной проблемой. Традиционные архитектуры моделей часто требуют больших вычислительных ресурсов, что приводит к снижению эффективности их использования в реальном времени. В этом контексте важно разработать метод, который обеспечивает высокую точность классификации и эффективность в ресурсозависимых средах.
## Метод
Предложенный метод основывается на улучшенной архитектуре ConvNeXt-Tiny, которая была значительно оптимизирована для решения задачи классификации медицинских изображений. Метод включает в себя несколько основных компонентов:
1. **Улучшенная структура:** Для улучшения возможностей выделения признаков в ConvNeXt-Tiny была введена стратегия фу mergersion с использованием **Global Average Pooling** и **Global Max Pooling**. Эти две методы позволяют сохранить глобальные статистические признаки и острые ответы.
2. **Легковесный модуль Attention:** Был разработан модуль Squeeze-and-Excitation Vector (SEVector), который позволяет адаптивно настраивать веса каналов, уменьшая при этом объем параметров.
3. **Feature Smoothing Loss:** Для повышения точности классификации и сохранения консистентности признаков в пределах класса была добавлена особая потеря Feature Smoothing Loss.
Эти изменения были выполнены с целью оптимизировать вычислительные затраты и повысить точность классификации в условиях ограниченных ресурсов.
## Результаты
Проведенные эксперименты показали, что предложенный метод достигает высокой точности классификации в условиях ограниченных вычислительных ресурсов. На CPU с 8 потоками и 10 эпохах обучения, модель достигла максимальной точности 89.10%, с очень стабильным убыванием функции потерь. Эти результаты указывают на эффективность разработанного подхода в сочетании с оптимизированной архитектурой ConvNeXt-Tiny.
## Значимость
Предложенный подход может быть применен в следующих областях:
- **Клиническая диагностика:** Эффективная классификация медицинских изображений может облегчить работу врачей, ускорив процесс диагностики.
- **Удаленная диагностика:** Применение в удаленных средях с ограниченными ресурсами, например, в медицинских центрах с недостаточным вычислительным оборудованием.
- **Мобильное приложение:** Модель может быть использована в мобильных приложениях для быстрого анализа изображений.
Значимыми преимуществами этого подхода являются:
- Улучшенная точность классификации.
-
Abstract
Intelligent analysis of medical imaging plays a crucial role in assisting
clinical diagnosis. However, achieving efficient and high-accuracy image
classification in resource-constrained computational environments remains
challenging. This study proposes a medical image classification method based on
an improved ConvNeXt-Tiny architecture. Through structural optimization and
loss function design, the proposed method enhances feature extraction
capability and classification performance while reducing computational
complexity. Specifically, the method introduces a dual global pooling (Global
Average Pooling and Global Max Pooling) feature fusion strategy into the
ConvNeXt-Tiny backbone to simultaneously preserve global statistical features
and salient response information. A lightweight channel attention module,
termed Squeeze-and-Excitation Vector (SEVector), is designed to improve the
adaptive allocation of channel weights while minimizing parameter overhead.
Additionally, a Feature Smoothing Loss is incorporated into the loss function
to enhance intra-class feature consistency and suppress intra-class variance.
Under CPU-only conditions (8 threads), the method achieves a maximum
classification accuracy of 89.10% on the test set within 10 training epochs,
exhibiting a stable convergence trend in loss values. Experimental results
demonstrate that the proposed method effectively improves medical image
classification performance in resource-limited settings, providing a feasible
and efficient solution for the deployment and promotion of medical imaging
analysis models.
Ссылки и действия
Дополнительные ресурсы: