Combating Noisy Labels via Dynamic Connection Masking
2508.09697v1
cs.LG, cs.CV
2025-08-15
Авторы:
Xinlei Zhang, Fan Liu, Chuanyi Zhang, Fan Cheng, Yuhui Zheng
Резюме на русском
```## Контекст
Нетрудно предположить, что реальные данные часто содержат неточные или шумные метки, которые могут серьезно повлиять на качество моделей машинного обучения. Это особенно актуально в случае моделей с глубокими нейросетевыми архитектурами, которые способны быстро запоминать даже шумные или неверные метки. Изучение способов борьбы с этим шумом является ключевым вопросом в адаптивном машинном обучении.
Одним из перспективных подходов является регуляризация архитектуры нейронных сетей, чтобы уменьшить влияние неточных меток. Однако пока что многие исследования фокусируются на потерь (loss functions) и выборе образцов (sample selection), оставив регуляризацию архитектуры недостаточно подробно изученной. В данной работе мы обобщаем принципы регуляризации моделирования в рамках Kolmogorov-Arnold Networks (KANs) и предлагаем Dynamic Connection Masking (DCM) — механизм, который адаптивно подавляет менее важные связи в модели, оптимизируя её надёжность в условиях шумных меток.
```
```## Метод
Механизм Dynamic Connection Masking (DCM) предлагает адаптивный метод для определения и отключения менее важных связей в нейронных сетях. Основной идеей является оценка информационной ценности каждой связи в модели и её динамическое управление во время обучения.
Для MLP и KAN была разработана архитектура, в которой входы и выходы каждого слоя связаны динамическим маской. Это даёт возможность отключать менее важные связи и снижать влияние шума. Мы применяем специальный метод градиентного оценивания для классификации, который позволяет эффективно снижать градиентный шум.
Таким образом, DCM может быть интегрирован с различными методами борьбы с шумом в метках, такими как устойчивые функции потерь и выбор образцов. Это даёт гибкость в применении DCM в различных условиях.
```
```## Результаты
Мы провели эксперименты с использованием как синтетических данных с шумом меток, так и реальных тестовых наборов данных. Наши результаты показали, что DCM постоянно превосходит современные подходы по сопротивлению шумным меткам в классификационных задачах.
В сравнении с альтернативными методами, DCM не только повышает точность, но и уменьшает величину градиентного шума, что является критически важным при обучении с шумными метками.
Кроме того, мы провели эксперименты с Kolmogorov-Arnold Networks (KANs) и показали, что они показали высокую стойкость к шумным меткам в различных сценариях, превосходя Multi-Layer Perceptron Networks (MLPs).
```
```## Значимость
DCM может быть применен в различных областях моделей машинного обучения, в том числе в ситуациях, когда необходимо обучить модели на данных с шу
Abstract
Noisy labels are inevitable in real-world scenarios. Due to the strong
capacity of deep neural networks to memorize corrupted labels, these noisy
labels can cause significant performance degradation. Existing research on
mitigating the negative effects of noisy labels has mainly focused on robust
loss functions and sample selection, with comparatively limited exploration of
regularization in model architecture. Inspired by the sparsity regularization
used in Kolmogorov-Arnold Networks (KANs), we propose a Dynamic Connection
Masking (DCM) mechanism for both Multi-Layer Perceptron Networks (MLPs) and
KANs to enhance the robustness of classifiers against noisy labels. The
mechanism can adaptively mask less important edges during training by
evaluating their information-carrying capacity. Through theoretical analysis,
we demonstrate its efficiency in reducing gradient error. Our approach can be
seamlessly integrated into various noise-robust training methods to build more
robust deep networks, including robust loss functions, sample selection
strategies, and regularization techniques. Extensive experiments on both
synthetic and real-world benchmarks demonstrate that our method consistently
outperforms state-of-the-art (SOTA) approaches. Furthermore, we are also the
first to investigate KANs as classifiers against noisy labels, revealing their
superior noise robustness over MLPs in real-world noisy scenarios. Our code
will soon be publicly available.
Ссылки и действия
Дополнительные ресурсы: