Deep Skin Lesion Segmentation with Transformer-CNN Fusion: Toward Intelligent Skin Cancer Analysis

2508.14509v1 eess.IV, cs.CV 2025-08-22
Авторы:

Xin Wang, Xiaopei Zhang, Xingang Wang

Резюме на русском

## Контекст Исследование рассматривает проблемы анализа злокачественных тканевых повреждений на злоупотребление, который требует высокой точности и производительности. Злоупотребление может быть выражено в разных формах, включая как визуально-структурные, так и химические изменения в тканях. Существующие решения часто страдают от снижения точности и проблем с границами образов, что снижает их подходность для автоматического анализа. Есть необходимость в разработке более точных и устойчивых методов, которые могут обрабатывать сложные структуры и границы в образах. Мотивация заключается в создании метода, который мог бы улучшить анализ и оптимизировать процесс диагностики, обеспечив высокую точность и устойчивость в обработке таких изображений. ## Метод Для решения указанных проблем, авторы предлагают новую архитектуру, которая объединяет модуль трансформера с классическим конвейером преобразования изображений, использующим как "encoder" так и "decoder". Трансформер используется для получения глобальной семантической информации, а конвейер сохраняет локальные фичи, такие как границы и текстуры. Для улучшения локальных границ используется аттенцион-механизм, а для повышения точности граничного разделения используется метод многоуровневого восстановления границ. Архитектура также включает в себя многоуровневый путь для восстановления размера изображения, что позволяет улучшить консистентность и точность сегментации. Метод был оптимизирорван с помощью различных тестов и анализов, включая сравнительные испытания, анализ чувствительности параметров и эффект данных аугментации. ## Результаты В ходе экспериментов, проведенных на различных наборах данных, показано, что предлагаемый подход показывает значительное улучшение показателей mIoU, mDice и mAcc по сравнению с другими методами. Особое внимание уделено граничной реконструкции и восстановлению структур в сложных случаях. Модель показала высокую устойчивость к изменению разрешения входных изображений и кросс-данных. Эти результаты подтверждают эффективность нового метода в обработке сложных структур и границ в образах, что делает его подходящим для применения в медицинской обработке изображений, в частности, для анализа кожных повреждений. ## Значимость Разработанный метод может быть применен в различных областях, включая медицинскую информатику, анализ кожных повреждений, клиническую диагностику и исследования. Он предлагает значительные преимущества, такие как улучшение точности распознавания и устойчивость к различным факторам, таким как разрешение

Abstract

This paper proposes a high-precision semantic segmentation method based on an improved TransUNet architecture to address the challenges of complex lesion structures, blurred boundaries, and significant scale variations in skin lesion images. The method integrates a transformer module into the traditional encoder-decoder framework to model global semantic information, while retaining a convolutional branch to preserve local texture and edge features. This enhances the model's ability to perceive fine-grained structures. A boundary-guided attention mechanism and multi-scale upsampling path are also designed to improve lesion boundary localization and segmentation consistency. To verify the effectiveness of the approach, a series of experiments were conducted, including comparative studies, hyperparameter sensitivity analysis, data augmentation effects, input resolution variation, and training data split ratio tests. Experimental results show that the proposed model outperforms existing representative methods in mIoU, mDice, and mAcc, demonstrating stronger lesion recognition accuracy and robustness. In particular, the model achieves better boundary reconstruction and structural recovery in complex scenarios, making it well-suited for the key demands of automated segmentation tasks in skin lesion analysis.

Ссылки и действия