📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 0
Последнее обновление: сегодня
📄 Ensemble YOLO Framework for Multi-Domain Mitotic Figure Detection in Histopathology Images
2025-09-05Авторы:
Navya Sri Kelam, Akash Parekh, Saikiran Bonthu, Nitin Singhal
## Контекст
Детекция митотических фигур в области цифровой патологии является ключевым заданием для оценки развития раковых опухолей. Однако этот процесс сложен из-за небольшого количества митотических фигур, их морфологического разнообразия и морфологических изменениях, возникающих в результате патологического процесса. Эти факторы способствуют высокой степени вариативности исходных данных. Для решения этих проблем появилась серия MIDOG соревнований, которая предоставляет стандартизированные бенчмарки для оценки различных подходов к детекции. Данная работа сосредоточена на исследовании моделей YOLOv5 и YOLOv8 для детекции митотических фигур в цифровых исследованиях, с целью оценить их независимость от цветной обработки и текстуры изображений.
## Метод
Для обучения использовались данные из наборов MIDOG++, CMC и CCMCT. Для повышения устойчивости к различным цветным и текстурным изменениям в процессе стадии обучения применялись техники цветной инвариантности и текстурной преобразовательности. Для внутренней валидации сравнивали YOLOv5 и YOLOv8 на точность и восприятии. Чтобы сгладить отрицательные эффекты каждой модели, воспользовались методом эnssemble, объединив модели YOLOv5 и YOLOv8. Это позволило повысить точность и восприятие в целом.
## Результаты
В результате внутренней валидации YOLOv5 показал высокую точность, в то время как YOLOv8 демонстрировал лучшую восприятия. Использование метода эnssemble позволило достичь более высокой сенситивности без значительного снижения точности. Таким образом, сочетание этих двух моделей дало лучшие результаты в целом.
## Значимость
Данные работы имеют значимый практический потенциал в области цифровой патологии. Высокая точность и восприятие моделей YOLOv5 и YOLOv8, объединенных в эnssemble, могут повысить качество детекции митотических фигур. Это может привести к улучшению понимания развития раковых опухолей и их диагностики.
## Выводы
Результаты данной работы показали, что модели YOLOv5 и YOLOv8, объединенные в эnssemble, позволяют достичь высокой сенситивности и точности в детекции митотических фигур. Данный подход является продвинутым и может быть применен в дальнейших исследованиях для улучшения автоматизированной диагностики в цифровой патологии. Будущие исследования будут направлены на повышение универсальности и общих характеристик детекции в разных данных.
Annotation:
Accurate detection of mitotic figures in whole slide histopathological images
remains a challenging task due to their scarcity, morphological heterogeneity,
and the variability introduced by tissue preparation and staining protocols.
The MIDOG competition series provides standardized benchmarks for evaluating
detection approaches across diverse domains, thus motivating the development of
generalizable deep learning models. In this work, we investigate the
performance of two modern one-stage dete...
Авторы:
Nishan Rai, Sujan Khatri, Devendra Risal
## Контекст
Определение рака легких на ранней стадии является критически важным для улучшения прогноза болезни и повышения выживаемости пациентов. Однако традиционные методы диагностики часто требуют значительных временных и ресурсных затрат, а также зависят от опыта специалистов. Это приводит к задержкам в обнаружении и несогласованности в диагностике. Нейронные сети, особенно глубокие, показали свою эффективность в автоматизации такой диагностики. Несмотря на это, многие из них не предоставляют понятных объяснений для клинических специалистов, что ограничивает их применение в практических ситуациях.
## Метод
Мы применили экзордическую архитектуру сверточных нейронных сетей (CNN), настроенную на диагностику рака легких с помощью трех классов: нормальное состояние, бенигная форма рака и малянгная форма. Использовались данные из набора IQ-OTH/NCCD (1,197 сканов). Для обучения использовалась пользовательская CNN-архитектура и три предварительно обученных модели: DenseNet121, ResNet152 и VGG19. Для борьбы с неравномерностью классов применялась техника cost-sensitive learning. Для улучшения прозрачности интерпретируемости результатов внедряется метод Shapley Additive Explanations (SHAP).
## Результаты
Модели DenseNet121 и ResNet152 показали самые высокие показатели в сравнении с другими моделями. DenseNet121 демонстрировал лучшую сбалансированность в показателях precision (92%), recall (90%) и F1-score (91%). ResNet152, в свою очередь, достиг более высокой точности (97.3%). Эти модели были оценены с использованием метрик ROC-AUC, accuracy и других, что подтвердило их высокую эффективность в диагностике. Дополнительно, SHAP-анализ позволил показать, какие части изображений в CT-сканах способствуют данному прогнозу, что улучшило понимание решений модели.
## Значимость
Результаты имеют большое значение для клинической практики, так как обеспечивают быструю, точную и понятную поддержку в диагностике рака легких. Это особенно важно для ресурсораспределенных сред, где доступ к экспертам ограничен. Интеграция explainability в модели не только повышает доверие к результатам, но и позволяет клиническим специалистам более эффективно использовать информацию в решениях о лечении.
## Выводы
Результаты исследований показали, что CNN-модели с интегрированной explainability могут предоставить эффективную и надежную поддержку в диагностике рака легких. Область применения таких моделей включает не только клинические ситуации, но и мониторинг здоровья населения в условиях удаленного контроля. Будущие исследования будут посвящены улучшению точности моделей, расширению наборов д
Annotation:
Early detection of lung cancer is critical to improving survival outcomes. We
present a deep learning framework for automated lung cancer screening from
chest computed tomography (CT) images with integrated explainability. Using the
IQ-OTH/NCCD dataset (1,197 scans across Normal, Benign, and Malignant classes),
we evaluate a custom convolutional neural network (CNN) and three fine-tuned
transfer learning backbones: DenseNet121, ResNet152, and VGG19. Models are
trained with cost-sensitive learnin...