Learning to Forget with Information Divergence Reweighted Objectives for Noisy Labels

2508.06622v1 cs.LG, stat.ML 2025-08-13

Авторы:

Jeremiah Birrell, Reza Ebrahimi

Резюме на русском

################################# ## Контекст ################################# Научное исследование посвящено решению проблемы обучения сетей классификации в условиях возможности ошибок в меток. Такие ошибки в метках обычно возникают из-за человеческих ошибок, машинной ошибки или злоупотребления вношащими метки. Эти неверные метки могут сильно влиять на эффективность обучения, приводя к ошибкам классификации и ухудшению качества. Основной мотивацией является поиск методов, позволяющих сетям не только изучать правильные связи между признаками и метками, но и адаптироваться к ошибкам в метках, избегая их влияния на обучение. ################################# ## Метод ################################# Авторы предлагают метод обучения, основанный на информационной разности. Он определяется с помощью релаксации с помощью дивергенции информации. Метод имеет адверсарскую архитектуру и позволяет уменьшить влияние зашумленных меток на обучение. Изменения в структуре предлагаемого метода позволяют эффективно обучать сеть, при этом указанный алгоритм имеет вычислительную сложность, близкую к стандартному кросс-энтропийному подходу. Эта эффективность достигается за счет новых стратегий регулирования влияния шумовых меток, которые изменяются в зависимости от ситуации. ################################# ## Результаты ################################# В ходе экспериментов были протестированы различные уровни шума в метках, включая симметричный, асимметричный, и шум в результате людского анализа. Результаты показали, что алгоритм ANTIDOTE превосходит существующие подходы в ситуациях с шумом в метках. Он особенно эффективен при высоком уровне шума в метках. Его вычислительная сложность оказалась меньше, чем у многих аналогичных алгоритмов, что делает его привлекательным для практического применения. ################################# ## Значимость ################################# Предложенный метод может быть применен в ситуациях, где шум в метках является обычной проблемой, таких как работа с методами машинного обучения в реальном мире, где человеческие или автоматические ошибки в метках неизбежны. Благодаря своей эффективности и высокой скорости работы, ANTIDOTE может быть применен в сложных средах, где другие методы могут сталкиваться с проблемами воспроизводимости и качества оценки. ################################# ## Выводы ################################# Результаты исследования показали, что ANTIDOTE является эффективным способом обучения в условиях возможности шума в метках. Метод адаптируется к различным типам шума и позволяет сетям избегать ухудшения качества из-за неверных меток. Будущими направлениями исследований будет изучение дополнительных вариантов регулирования влияния шумовых меток и расширение применения метода на другие задачи машинного об

Abstract

We introduce ANTIDOTE, a new class of objectives for learning under noisy labels which are defined in terms of a relaxation over an information-divergence neighborhood. Using convex duality, we provide a reformulation as an adversarial training method that has similar computational cost to training with standard cross-entropy loss. We show that our approach adaptively reduces the influence of the samples with noisy labels during learning, exhibiting a behavior that is analogous to forgetting those samples. ANTIDOTE is effective in practical environments where label noise is inherent in the training data or where an adversary can alter the training labels. Extensive empirical evaluations on different levels of symmetric, asymmetric, human annotation, and real-world label noise show that ANTIDOTE outperforms leading comparable losses in the field and enjoys a time complexity that is very close to that of the standard cross entropy loss.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Learning to Forget with Information Divergence Reweighted Objectives for Noisy Labels

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Breaking Determinism: Stochastic Modeling for Reliable Off-Policy Evaluation in ...

Tuning-Free Structured Sparse Recovery of Multiple Measurement Vectors using Imp...

GaussDetect-LiNGAM:Causal Direction Identification without Gaussianity test

Parameter-Efficient Augment Plugin for Class-Incremental Learning

Mitigating the Curse of Detail: Scaling Arguments for Feature Learning and Sampl...

Навигация