CLoE: Curriculum Learning on Endoscopic Images for Robust MES Classification

2508.13280v1 cs.CV, cs.LG 2025-08-21
Авторы:

Zeynep Ozdemir, Hacer Yalim Keles, Omer Ozgur Tanriover

Резюме на русском

#### Контекст Оценка степени заболевания язвенной колитиса (UC) с помощью эндоскопических изображений является ключевым элементом в диагностике и контроле заболевания. Одним из наиболее часто используемых масштабов для оценки степени воспаления является Mayo Endoscopic Subscore (MES). Тем не менее, классификация по MES сталкивается с рядовыми трудностей, включая неточности в метках, вызванные интер-операторской различием, и алгоритмическими проблемами, связанными с ординальной природой метода. Для решения этих проблем мы предлагаем CLoE — модель, основанную на учебе по группировке, которая учитывает не только неопределенность меток, но и ординальную структуру системы оценки. #### Метод CLoE использует простой учителя, оценивающий надежность меток на основе легковесной модели, обученной на данных Boston Bowel Preparation Scale (BBPS). Эта модель строит приоритетную очередность образов, от "чистых" (понятных) до "грязных" (шумных). Эта очередность используется для создания курсивного обучения, где проще образы обрабатываются первыми, а сложные — позднее. Для улучшения устойчивости к шумам вводится инновационная аугментация ResizeMix, которая объединяет две изображения в одно, заставляя сеть изучить области, отличающиеся по степени разрешения и детализации. Модель поддерживает использование двух архитектур: сверточных сетей (ConvNeXt-Tiny) и трансформеров. #### Результаты Проведенные эксперименты на двух наборах данных — LIMUC и HyperKvasir — показали, что CLoE превосходит существующие подходы. Например, ConvNeXt-Tiny с CLoE достигает до 82.5% точности и QWK (Quadratic Weighted Kappa) 0.894 на LIMUC с минимальными затратами ресурсов. Эти результаты подтверждают эффективность CLoE в обработке шумных меток и улучшении классификации ординальных классов. #### Значимость CLoE может быть использована в различных областях, где требуется классификация под разными условиями шума в метках или при ординальной природе данных. Ее применение может повысить точность диагностики в медицине, а также в других областях, где имеются шумные метки или неоднородные данные. Значительным преимуществом является уменьшение времени обучения и увеличение точности без необходимости использовать дорогие модели. #### Выводы CLoE демонстрирует успешное использование курсивного обучения для значительного повышения точности работы моделей в задачах классификации с шумовыми метками. Будущие исследования будут посвящены расширению применения CLoE к другим ситуациям, включая несвязанные задачи, и изучению возможности улучшения методов регуляризации и аугментации.

Abstract

Estimating disease severity from endoscopic images is essential in assessing ulcerative colitis, where the Mayo Endoscopic Subscore (MES) is widely used to grade inflammation. However, MES classification remains challenging due to label noise from inter-observer variability and the ordinal nature of the score, which standard models often ignore. We propose CLoE, a curriculum learning framework that accounts for both label reliability and ordinal structure. Image quality, estimated via a lightweight model trained on Boston Bowel Preparation Scale (BBPS) labels, is used as a proxy for annotation confidence to order samples from easy (clean) to hard (noisy). This curriculum is further combined with ResizeMix augmentation to improve robustness. Experiments on the LIMUC and HyperKvasir datasets, using both CNNs and Transformers, show that CLoE consistently improves performance over strong supervised and self-supervised baselines. For instance, ConvNeXt-Tiny reaches 82.5\% accuracy and a QWK of 0.894 on LIMUC with low computational cost. These results highlight the potential of difficulty-aware training strategies for improving ordinal classification under label uncertainty. Code will be released at https://github.com/zeynepozdemir/CLoE.

Ссылки и действия