Efficient Fine-Tuning of DINOv3 Pretrained on Natural Images for Atypical Mitotic Figure Classification in MIDOG 2025
2508.21041v1
eess.IV, cs.CV
2025-08-30
Авторы:
Guillaume Balezo, Raphaël Bourgade, Thomas Walter
Резюме на русском
## Контекст
Атипичные митотические фигуры (AMF) являются признаками неоднородного и недостаточного деления клетки, которые связаны с неблагоприятным прогнозом. Однако их детектирование представляет собой трудную задачу из-за низкой преvalence, тонкой морфологии и высокой интер-наблюдательной гомотропности. Характеристики этих фигур чрезвычайно важны для клинической практики, но их выявление чрезвычайно сложно. MIDOG 2025 представляет собой бенчмарк для классификации AMF в различных областях, включая гистопатологию. В данном исследовании мы исследуем возможности новой модели DINOv3-H+, которая была обучена на натуральных изображениях, и рассмотрим ее файн-тюнинг с помощью низкорангового адаптирования (LoRA) и расширенного аугментирования.
## Метод
Мы начали с предварительно обученной модели DINOv3-H+, которая была адаптирована к задаче классификации AMF. Для тонкой адаптации использовался метод LoRA, который позволяет переносить модель с минимальным количеством параметров (650 тысяч) и эффективно обучать ее для новой задачи. Для увеличения устойчивости и разнообразия данных использовались различные методы аугментации. Мы оценили DINOv3-H+ на корпусе данных MIDOG 2025, сравнивая его производительность с другими моделями.
## Результаты
DINOv3-H+ показала сильную передачу из прикладного теста на натуральные изображения на задачу классификации AMF. Модель достигла балансированной точности 0,8871 на предварительном тестовом наборе данных MIDOG 2025. Этот результат указывает на высокую эффективность DINOv3-H+ в передаче известных признаков из изображений на новую задачу. Основным фактором успеха является LoRA-файн-тюнинг, который позволил адаптировать модель к новым данным с минимальным потреблением параметров и высокой эффективностью.
## Значимость
Наше исследование открывает новые пути для использования моделей, обученных на натуральных изображениях, в клинических задачах, таких как классификация AMF. DINOv3-H+ оказалась высокоэффективной в передаче известных признаков, даже при отсутствии полного переобучения на новых данных. Эта модель предоставляет новый подход к адаптации моделей для задач, требующих высокой точности и низкого потребления ресурсов.
## Выводы
Мы показали, что DINOv3-H+, обученная на натуральных изображениях, является перспективной моделью для классификации AMF. Файн-тюнинг с помощью LoRA позволяет эффективно адаптировать модель к новым задачам с минимальным потреблением ресурсов. Мы планируем продолжить работу над улучшением процесса файн-тюнинга и исследованием других моделей для кла
Abstract
Atypical mitotic figures (AMFs) are markers of abnormal cell division
associated with poor prognosis, yet their detection remains difficult due to
low prevalence, subtle morphology, and inter-observer variability. The MIDOG
2025 challenge introduces a benchmark for AMF classification across multiple
domains. In this work, we evaluate the recently published DINOv3-H+ vision
transformer, pretrained on natural images, which we fine-tuned using low-rank
adaptation (LoRA, 650k trainable parameters) and extensive augmentation.
Despite the domain gap, DINOv3 transfers effectively to histopathology,
achieving a balanced accuracy of 0.8871 on the preliminary test set. These
results highlight the robustness of DINOv3 pretraining and show that, when
combined with parameter-efficient fine-tuning, it provides a strong baseline
for atypical mitosis classification in MIDOG 2025.
Ссылки и действия
Дополнительные ресурсы: