Bladder Cancer Diagnosis with Deep Learning: A Multi-Task Framework and Online Platform
2508.15379v1
eess.IV, cs.AI, cs.CV
2025-08-23
Авторы:
Jinliang Yu, Mingduo Xie, Yue Wang, Tianfan Fu, Xianglai Xu, Jiajun Wang
Резюме на русском
## Контекст
Клиническая цистоскопия, являющаяся стандартным методом диагностики рака мочевого пузыря, сильно зависит от опыта врача, что приводит к разногласиям и субъективности в результатах диагностики. В связи с этим возникает необходимость в разработке объективных, точных и эффективных вычислительных подходов для улучшения диагностики рака мочевого пузыря. Deep learning, в свою очередь, показал свою эффективность в обработке изображений, что делает его применимым для решения этой проблемы.
## Метод
Разработанное многозадачное deep-learning-программное обеспечение призвано улучшить диагностику рака мочевого пузыря с помощью различных моделей. Основной функцией этой модели является классификация рака мочевого пузыря на основе снимков цистоскопии. Для этого использована модель EfficientNet-B0, улучшенная с помощью Convolutional Block Attention Module (CBAM), что позволяет улучшить привлечение признаков. Для сегментации областей интереса рака использована ResNet34-UNet++ с актуализацией внимания и аттенционным гатингом. Для молекулярной классификации использована ConvNeXt-Tiny, которая позволяет определять маркеры HER-2 и Ki-67. Также была разработана интерактивная online-платформа, позволяющая визуализировать результаты работы моделей, работать с разными форматами изображений, устанавливать динамические пороговые значения и предоставлять интерфейс на нескольких языках.
## Результаты
В клинических испытаниях модель EfficientNet-B0 с CBAM показала высокую точность (93.28%), F1-меру (82.05%) и AUC (96.41%) для классификации рака мочевого пузыря. Модель сегментации ResNet34-UNet++ с актуализацией внимания и аттенционным гатингом показала Dice-коеффициент в 0.9091. Модель ConvNeXt-Tiny, ответственная за молекулярную классификацию, также достигла высоких результатов. Интегрированная платформа, включающая все разработанные модели, увеличила эффективность диагностики, сделала её более доступной и удобной для пользователей.
## Значимость
Разработанное многозадачное deep-learning-решение может быть применено в различных областях урологии для улучшения диагностики рака мочевого пузыря. Внедрение этой модели может повысить точность диагностики, уменьшить зависимость от опыта врача, и облегчить процесс диагностики. Благодаря интегрированной online-платформе, пользователи могут получать реальное время диагностическую информацию, что повышает эффективность диагностического процесса.
## Выводы
Разработанный многозадачный подход к диагностике рака мочевого пузыря с помощью deep learning доказал свою эффективность, показав высокую точность, F1-меру и AUC
Abstract
Clinical cystoscopy, the current standard for bladder cancer diagnosis,
suffers from significant reliance on physician expertise, leading to
variability and subjectivity in diagnostic outcomes. There is an urgent need
for objective, accurate, and efficient computational approaches to improve
bladder cancer diagnostics.
Leveraging recent advancements in deep learning, this study proposes an
integrated multi-task deep learning framework specifically designed for bladder
cancer diagnosis from cystoscopic images. Our framework includes a robust
classification model using EfficientNet-B0 enhanced with Convolutional Block
Attention Module (CBAM), an advanced segmentation model based on
ResNet34-UNet++ architecture with self-attention mechanisms and attention
gating, and molecular subtyping using ConvNeXt-Tiny to classify molecular
markers such as HER-2 and Ki-67. Additionally, we introduce a Gradio-based
online diagnostic platform integrating all developed models, providing
intuitive features including multi-format image uploads, bilingual interfaces,
and dynamic threshold adjustments.
Extensive experimentation demonstrates the effectiveness of our methods,
achieving outstanding accuracy (93.28%), F1-score (82.05%), and AUC (96.41%)
for classification tasks, and exceptional segmentation performance indicated by
a Dice coefficient of 0.9091. The online platform significantly improved the
accuracy, efficiency, and accessibility of clinical bladder cancer diagnostics,
enabling practical and user-friendly deployment. The code is publicly
available.
Our multi-task framework and integrated online tool collectively advance the
field of intelligent bladder cancer diagnosis by improving clinical
reliability, supporting early tumor detection, and enabling real-time
diagnostic feedback. These contributions mark a significant step toward
AI-assisted decision-making in urology.
Ссылки и действия
Дополнительные ресурсы: