Ordinal Adaptive Correction: A Data-Centric Approach to Ordinal Image Classification with Noisy Labels
2509.02351v1
cs.CV, cs.AI, cs.LG
2025-09-05
Авторы:
Alireza Sedighi Moghaddam, Mohammad Reza Mohammadi
Резюме на русском
#### Контекст
Обучение супервизионных нейронных сетей в задачах компьютерного зрения требует больших объемов качественно отмеченных данных. Однако обработка и отметка изображений, особенно при определении ординальных классов, где границы классов неясны, часто приводит к ошибкам и шуму в меток. Этот шум может существенно снизить точность и достоверность моделей глубокого обучения. В данной работе авторы сосредоточились на задаче обнаружения и исправления шума в метках при ординальной классификации изображений.
#### Метод
Предложен метод ORDinal Adaptive Correction (ORDAC), основанный на Label Distribution Learning (LDL). Данный подход адаптивно исправляет метки во время обучения, динамически устанавливая среднее и стандартное отклонение распределения меток для каждого примера. Это позволяет использовать весь набор данных, включая потенциально шумные метки, вместо их отбрасывания. ORDAC отличается гибкостью и устойчивостью к различным видам шума в метках. Метод был развит в рамках расширенных версий ORDAC_C и ORDAC_R, учитывающих дополнительные характеристики данных.
#### Результаты
Эксперименты проводились на двух бенчмарковых датасетах: для оценки возраста (Adience) и детекции степени заболевания диабетической ретинопатии. Шумовые метки симулировались асимметричным гауссовым шумом. Результаты показали, что ORDAC существенно улучшает показатели моделей: на датасете Adience с 40% шума, ORDAC_R снизил среднюю абсолютную ошибку с 0.86 до 0.62 и увеличил метрику реколл с 0.37 до 0.49. Также была продемонстрирована эффективность метода в устранении внутреннего шума в оригинальных данных.
#### Значимость
Предложенный подход может быть применен в задачах, где метоки изображений шумообъемлемы или неточны. Он обеспечивает улучшение качества и надёжности моделей, уменьшая влияние шума. Особенно актуален ORDAC для задач, где классы имеют естественную последовательность, таких как возрастная оценка или степень заболеваний. Работа открывает пути для будущих исследований в области адаптивной коррекции меток и использования LDL в обучении с шумом.
#### Выводы
Результаты показывают, что ORDAC, ORDAC_C и ORDAC_R эффективно исправляют шум в метках и повышают точность моделей в задачах ординальной классификации. Данный подход является основополагающим для повышения устойчивости моделей к шуму в метках и открывает пути для дальнейшего исследования методов LDL в обучении с неточными метками.
Abstract
Labeled data is a fundamental component in training supervised deep learning
models for computer vision tasks. However, the labeling process, especially for
ordinal image classification where class boundaries are often ambiguous, is
prone to error and noise. Such label noise can significantly degrade the
performance and reliability of machine learning models. This paper addresses
the problem of detecting and correcting label noise in ordinal image
classification tasks. To this end, a novel data-centric method called ORDinal
Adaptive Correction (ORDAC) is proposed for adaptive correction of noisy
labels. The proposed approach leverages the capabilities of Label Distribution
Learning (LDL) to model the inherent ambiguity and uncertainty present in
ordinal labels. During training, ORDAC dynamically adjusts the mean and
standard deviation of the label distribution for each sample. Rather than
discarding potentially noisy samples, this approach aims to correct them and
make optimal use of the entire training dataset. The effectiveness of the
proposed method is evaluated on benchmark datasets for age estimation (Adience)
and disease severity detection (Diabetic Retinopathy) under various asymmetric
Gaussian noise scenarios. Results show that ORDAC and its extended versions
(ORDAC_C and ORDAC_R) lead to significant improvements in model performance.
For instance, on the Adience dataset with 40% noise, ORDAC_R reduced the mean
absolute error from 0.86 to 0.62 and increased the recall metric from 0.37 to
0.49. The method also demonstrated its effectiveness in correcting intrinsic
noise present in the original datasets. This research indicates that adaptive
label correction using label distributions is an effective strategy to enhance
the robustness and accuracy of ordinal classification models in the presence of
noisy data.
Ссылки и действия
Дополнительные ресурсы: