Towards Optimal Convolutional Transfer Learning Architectures for Breast Lesion Classification and ACL Tear Detection

2508.17567v2 cs.CV, cs.LG, 68T45 2025-08-27
Авторы:

Daniel Frees, Moritz Bolling, Aditri Bhagirath

Резюме на русском

#### Контекст Модерная компьютерная визуализация нашла широкое применение в медицинских иммуниграциях, включая классификацию и сегментацию изображений. Однако, существующие модели часто сталкиваются с ограниченным размером медицинских данных, что снижает их эффективность. Трансферное обучение (transfer learning) стало ключевым решением этой проблемы, позволяя использовать предобученные модели на больших объемах данных для улучшения классификации на малых датасетах. Ранее, Mei et al. (2022) обнаружили, что предобучение CNN-моделей на большой выборке изображений, отмеченных радиологами (RadImageNet), повысило качество решения задач классификации по сравнению с предобучениями на ImageNet. В данной работе мы проводим подробное исследование для определения оптимальных архитектур конволюционных нейронных сетей для диагностики злокачественных подвздошных зубков и разрывов связок анатрофий (ACL), а также проводим статистический анализ влияния RadImageNet и ImageNet на последующие результаты модели. #### Метод Мы исследуем различные архитектуры конволюционных нейронных сетей с различными типами слоев, включая 1D-конволюции, полносвязные слои и skip-соединения. Модели предобучены на большом датасете RadImageNet или ImageNet, затем принимают участие в трейнинге на малых датасетах для классификации злокачественных подвздошных зубков и разрывов ACL. Мы рассматриваем стратегии, такие как полное и частичное размотывание бэкбоны, чтобы оптимизировать последующие результаты. Для сравнения, мы используем метрики AUC (Area Under Curve) для оценки качества классификации. #### Результаты Наши эксперименты показали, что 1D-конволюционные классификаторы с skip-соединениями, бэкбонами ResNet50 и частичным размотом бэкбона демонстрируют оптимальные результаты. Мы получили AUC 0.9969 для диагностики разрывов ACL и 0.9641 для классификации злокачественных подвздошных зубков. Эти результаты сравнимы с теми, полученными Mei et al. (2022), и превосходят другие работы в этой области. Наши исследования не подтвердили, что RadImageNet предобучение обеспечивает лучшую последующую производительность для задач классификации подвздошных зубков и разрывов ACL. #### Значимость Наша работа имеет большое значение для развития медицинских искусственных нейронных сетей. Оптимальные архитектуры, разработанные в этом исследовании, могут использоваться для других задач классификации медицинских изображений, включая диагностику раковых опухолей и инфекций. Мы также подтвердили, что предобучение на больших датасетах не всегда является существенным фактором для повышения модели, что мож

Abstract

Modern computer vision models have proven to be highly useful for medical imaging classification and segmentation tasks, but the scarcity of medical imaging data often limits the efficacy of models trained from scratch. Transfer learning has emerged as a pivotal solution to this, enabling the fine-tuning of high-performance models on small data. Mei et al. (2022) found that pre-training CNNs on a large dataset of radiologist-labeled images (RadImageNet) enhanced model performance on downstream tasks compared to ImageNet pretraining. The present work extends Mei et al. (2022) by conducting a comprehensive investigation to determine optimal CNN architectures for breast lesion malignancy detection and ACL tear detection, as well as performing statistical analysis to compare the effect of RadImageNet and ImageNet pre-training on downstream model performance. Our findings suggest that 1-dimensional convolutional classifiers with skip connections, ResNet50 pre-trained backbones, and partial backbone unfreezing yields optimal downstream medical classification performance. Our best models achieve AUCs of 0.9969 for ACL tear detection and 0.9641 for breast nodule malignancy detection, competitive with the results reported by Mei et al. (2022) and surpassing other previous works. We do not find evidence confirming RadImageNet pre-training to provide superior downstream performance for ACL tear and breast lesion classification tasks.

Ссылки и действия