Ensemble YOLO Framework for Multi-Domain Mitotic Figure Detection in Histopathology Images

2509.02957v1 eess.IV, cs.CV, 68T07, I.4.9; I.5.4 2025-09-05
Авторы:

Navya Sri Kelam, Akash Parekh, Saikiran Bonthu, Nitin Singhal

Резюме на русском

## Контекст Детекция митотических фигур в области цифровой патологии является ключевым заданием для оценки развития раковых опухолей. Однако этот процесс сложен из-за небольшого количества митотических фигур, их морфологического разнообразия и морфологических изменениях, возникающих в результате патологического процесса. Эти факторы способствуют высокой степени вариативности исходных данных. Для решения этих проблем появилась серия MIDOG соревнований, которая предоставляет стандартизированные бенчмарки для оценки различных подходов к детекции. Данная работа сосредоточена на исследовании моделей YOLOv5 и YOLOv8 для детекции митотических фигур в цифровых исследованиях, с целью оценить их независимость от цветной обработки и текстуры изображений. ## Метод Для обучения использовались данные из наборов MIDOG++, CMC и CCMCT. Для повышения устойчивости к различным цветным и текстурным изменениям в процессе стадии обучения применялись техники цветной инвариантности и текстурной преобразовательности. Для внутренней валидации сравнивали YOLOv5 и YOLOv8 на точность и восприятии. Чтобы сгладить отрицательные эффекты каждой модели, воспользовались методом эnssemble, объединив модели YOLOv5 и YOLOv8. Это позволило повысить точность и восприятие в целом. ## Результаты В результате внутренней валидации YOLOv5 показал высокую точность, в то время как YOLOv8 демонстрировал лучшую восприятия. Использование метода эnssemble позволило достичь более высокой сенситивности без значительного снижения точности. Таким образом, сочетание этих двух моделей дало лучшие результаты в целом. ## Значимость Данные работы имеют значимый практический потенциал в области цифровой патологии. Высокая точность и восприятие моделей YOLOv5 и YOLOv8, объединенных в эnssemble, могут повысить качество детекции митотических фигур. Это может привести к улучшению понимания развития раковых опухолей и их диагностики. ## Выводы Результаты данной работы показали, что модели YOLOv5 и YOLOv8, объединенные в эnssemble, позволяют достичь высокой сенситивности и точности в детекции митотических фигур. Данный подход является продвинутым и может быть применен в дальнейших исследованиях для улучшения автоматизированной диагностики в цифровой патологии. Будущие исследования будут направлены на повышение универсальности и общих характеристик детекции в разных данных.

Abstract

Accurate detection of mitotic figures in whole slide histopathological images remains a challenging task due to their scarcity, morphological heterogeneity, and the variability introduced by tissue preparation and staining protocols. The MIDOG competition series provides standardized benchmarks for evaluating detection approaches across diverse domains, thus motivating the development of generalizable deep learning models. In this work, we investigate the performance of two modern one-stage detectors, YOLOv5 and YOLOv8, trained on MIDOG++, CMC, and CCMCT datasets. To enhance robustness, training incorporated stain-invariant color perturbations and texture preserving augmentations. In internal validation, YOLOv5 achieved superior precision, while YOLOv8 provided improved recall, reflecting architectural trade-offs between anchor-based and anchor-free detection. To capitalize on these complementary strengths, we employed an ensemble of the two models, which improved sensitivity without a major reduction in precision. These findings highlight the effectiveness of ensemble strategies built upon contemporary object detectors to advance automated mitosis detection in digital pathology.

Ссылки и действия