Towards Real Unsupervised Anomaly Detection Via Confident Meta-Learning

2508.02293v1 cs.CV, cs.LG 2025-08-09
Авторы:

Muhammad Aqeel, Shakiba Sharifi, Marco Cristani, Francesco Setti

Резюме на русском

Одним из основных трудностей неортодоксального обучения (научные термины) является необходимость тщательного фильтрации данных, что может привести к выпадению значительных частей данных и, как следствие, к предрассудкам и ограниченной адаптивности моделей. **Заголовок** предлагает **Confident Meta-learning (CoMet)** — новую стратегию обучения, позволяющую моделям нейронных сетей учиться на неотфильтрованных данных, где присутствуют как нормальные, так и аномальные экземпляры. Эта стратегия основывается на объединении **Soft Confident Learning** (уменьшение веса низкоконфидентных примеров) и **Meta-Learning** (регулирование обновлений градиентов с помощью ковариации потерь). Эта стратегия значительно улучшает устойчивость моделей к шумам в данных и предотвращает переобучение. Тестирование CoMet на стандартных датасетах MVTec-AD, VIADUCT и KSDD2 показало его превосходство над базовыми методами, закрепляя новый статус лидера в области неортодоксального обучения.

Abstract

So-called unsupervised anomaly detection is better described as semi-supervised, as it assumes all training data are nominal. This assumption simplifies training but requires manual data curation, introducing bias and limiting adaptability. We propose Confident Meta-learning (CoMet), a novel training strategy that enables deep anomaly detection models to learn from uncurated datasets where nominal and anomalous samples coexist, eliminating the need for explicit filtering. Our approach integrates Soft Confident Learning, which assigns lower weights to low-confidence samples, and Meta-Learning, which stabilizes training by regularizing updates based on training validation loss covariance. This prevents overfitting and enhances robustness to noisy data. CoMet is model-agnostic and can be applied to any anomaly detection method trainable via gradient descent. Experiments on MVTec-AD, VIADUCT, and KSDD2 with two state-of-the-art models demonstrate the effectiveness of our approach, consistently improving over the baseline methods, remaining insensitive to anomalies in the training set, and setting a new state-of-the-art across all datasets.

Ссылки и действия