Bladder Cancer Diagnosis with Deep Learning: A Multi-Task Framework and Online Platform

2508.15379v1 eess.IV, cs.AI, cs.CV 2025-08-23
Авторы:

Jinliang Yu, Mingduo Xie, Yue Wang, Tianfan Fu, Xianglai Xu, Jiajun Wang

Резюме на русском

## Контекст Клиническая цистоскопия, являющаяся стандартным методом диагностики рака мочевого пузыря, сильно зависит от опыта врача, что приводит к разногласиям и субъективности в результатах диагностики. В связи с этим возникает необходимость в разработке объективных, точных и эффективных вычислительных подходов для улучшения диагностики рака мочевого пузыря. Deep learning, в свою очередь, показал свою эффективность в обработке изображений, что делает его применимым для решения этой проблемы. ## Метод Разработанное многозадачное deep-learning-программное обеспечение призвано улучшить диагностику рака мочевого пузыря с помощью различных моделей. Основной функцией этой модели является классификация рака мочевого пузыря на основе снимков цистоскопии. Для этого использована модель EfficientNet-B0, улучшенная с помощью Convolutional Block Attention Module (CBAM), что позволяет улучшить привлечение признаков. Для сегментации областей интереса рака использована ResNet34-UNet++ с актуализацией внимания и аттенционным гатингом. Для молекулярной классификации использована ConvNeXt-Tiny, которая позволяет определять маркеры HER-2 и Ki-67. Также была разработана интерактивная online-платформа, позволяющая визуализировать результаты работы моделей, работать с разными форматами изображений, устанавливать динамические пороговые значения и предоставлять интерфейс на нескольких языках. ## Результаты В клинических испытаниях модель EfficientNet-B0 с CBAM показала высокую точность (93.28%), F1-меру (82.05%) и AUC (96.41%) для классификации рака мочевого пузыря. Модель сегментации ResNet34-UNet++ с актуализацией внимания и аттенционным гатингом показала Dice-коеффициент в 0.9091. Модель ConvNeXt-Tiny, ответственная за молекулярную классификацию, также достигла высоких результатов. Интегрированная платформа, включающая все разработанные модели, увеличила эффективность диагностики, сделала её более доступной и удобной для пользователей. ## Значимость Разработанное многозадачное deep-learning-решение может быть применено в различных областях урологии для улучшения диагностики рака мочевого пузыря. Внедрение этой модели может повысить точность диагностики, уменьшить зависимость от опыта врача, и облегчить процесс диагностики. Благодаря интегрированной online-платформе, пользователи могут получать реальное время диагностическую информацию, что повышает эффективность диагностического процесса. ## Выводы Разработанный многозадачный подход к диагностике рака мочевого пузыря с помощью deep learning доказал свою эффективность, показав высокую точность, F1-меру и AUC

Abstract

Clinical cystoscopy, the current standard for bladder cancer diagnosis, suffers from significant reliance on physician expertise, leading to variability and subjectivity in diagnostic outcomes. There is an urgent need for objective, accurate, and efficient computational approaches to improve bladder cancer diagnostics. Leveraging recent advancements in deep learning, this study proposes an integrated multi-task deep learning framework specifically designed for bladder cancer diagnosis from cystoscopic images. Our framework includes a robust classification model using EfficientNet-B0 enhanced with Convolutional Block Attention Module (CBAM), an advanced segmentation model based on ResNet34-UNet++ architecture with self-attention mechanisms and attention gating, and molecular subtyping using ConvNeXt-Tiny to classify molecular markers such as HER-2 and Ki-67. Additionally, we introduce a Gradio-based online diagnostic platform integrating all developed models, providing intuitive features including multi-format image uploads, bilingual interfaces, and dynamic threshold adjustments. Extensive experimentation demonstrates the effectiveness of our methods, achieving outstanding accuracy (93.28%), F1-score (82.05%), and AUC (96.41%) for classification tasks, and exceptional segmentation performance indicated by a Dice coefficient of 0.9091. The online platform significantly improved the accuracy, efficiency, and accessibility of clinical bladder cancer diagnostics, enabling practical and user-friendly deployment. The code is publicly available. Our multi-task framework and integrated online tool collectively advance the field of intelligent bladder cancer diagnosis by improving clinical reliability, supporting early tumor detection, and enabling real-time diagnostic feedback. These contributions mark a significant step toward AI-assisted decision-making in urology.

Ссылки и действия