Learning to Forget with Information Divergence Reweighted Objectives for Noisy Labels
2508.06622v1
cs.LG, stat.ML
2025-08-13
Авторы:
Jeremiah Birrell, Reza Ebrahimi
Резюме на русском
#################################
## Контекст
#################################
Научное исследование посвящено решению проблемы обучения сетей классификации в условиях возможности ошибок в меток. Такие ошибки в метках обычно возникают из-за человеческих ошибок, машинной ошибки или злоупотребления вношащими метки. Эти неверные метки могут сильно влиять на эффективность обучения, приводя к ошибкам классификации и ухудшению качества. Основной мотивацией является поиск методов, позволяющих сетям не только изучать правильные связи между признаками и метками, но и адаптироваться к ошибкам в метках, избегая их влияния на обучение.
#################################
## Метод
#################################
Авторы предлагают метод обучения, основанный на информационной разности. Он определяется с помощью релаксации с помощью дивергенции информации. Метод имеет адверсарскую архитектуру и позволяет уменьшить влияние зашумленных меток на обучение. Изменения в структуре предлагаемого метода позволяют эффективно обучать сеть, при этом указанный алгоритм имеет вычислительную сложность, близкую к стандартному кросс-энтропийному подходу. Эта эффективность достигается за счет новых стратегий регулирования влияния шумовых меток, которые изменяются в зависимости от ситуации.
#################################
## Результаты
#################################
В ходе экспериментов были протестированы различные уровни шума в метках, включая симметричный, асимметричный, и шум в результате людского анализа. Результаты показали, что алгоритм ANTIDOTE превосходит существующие подходы в ситуациях с шумом в метках. Он особенно эффективен при высоком уровне шума в метках. Его вычислительная сложность оказалась меньше, чем у многих аналогичных алгоритмов, что делает его привлекательным для практического применения.
#################################
## Значимость
#################################
Предложенный метод может быть применен в ситуациях, где шум в метках является обычной проблемой, таких как работа с методами машинного обучения в реальном мире, где человеческие или автоматические ошибки в метках неизбежны. Благодаря своей эффективности и высокой скорости работы, ANTIDOTE может быть применен в сложных средах, где другие методы могут сталкиваться с проблемами воспроизводимости и качества оценки.
#################################
## Выводы
#################################
Результаты исследования показали, что ANTIDOTE является эффективным способом обучения в условиях возможности шума в метках. Метод адаптируется к различным типам шума и позволяет сетям избегать ухудшения качества из-за неверных меток. Будущими направлениями исследований будет изучение дополнительных вариантов регулирования влияния шумовых меток и расширение применения метода на другие задачи машинного об
Abstract
We introduce ANTIDOTE, a new class of objectives for learning under noisy
labels which are defined in terms of a relaxation over an
information-divergence neighborhood. Using convex duality, we provide a
reformulation as an adversarial training method that has similar computational
cost to training with standard cross-entropy loss. We show that our approach
adaptively reduces the influence of the samples with noisy labels during
learning, exhibiting a behavior that is analogous to forgetting those samples.
ANTIDOTE is effective in practical environments where label noise is inherent
in the training data or where an adversary can alter the training labels.
Extensive empirical evaluations on different levels of symmetric, asymmetric,
human annotation, and real-world label noise show that ANTIDOTE outperforms
leading comparable losses in the field and enjoys a time complexity that is
very close to that of the standard cross entropy loss.
Ссылки и действия
Дополнительные ресурсы: