Active Learning and Transfer Learning for Anomaly Detection in Time-Series Data

2508.03921v1 cs.LG, cs.AI 2025-08-09
Авторы:

John D. Kelleher, Matthew Nicholson, Rahul Agrahari, Clare Conran

Резюме на русском

**Резюме** В статье рассматривается эффективность сочетания активного обучения (active learning) и трансферного обучения (transfer learning) для обнаружения аномалий в временных рядах. Авторы исследовали, в какой степени эти подходы могут улучшить модели детектирования аномалий при работе с кросс-доменными данными. Основные находки указывают на то, что сочетание активного и трансферного обучения может улучшить производительность моделей, однако производительность лучше всего достигается при использовании одного кластера, то есть без применения кластеризации. Также было обнаружено, что добавление новых выборок с помощью активного обучения повышает качество модели, хотя темп улучшения менее заметен, чем в предыдущих работах, возможно из-за более точного экспериментального дизайна. Наконец, авторы оценили потенциальную высокую производительность трансферного обучения в сочетании с активным обучением и заметили, что хотя модель показывает исходное улучшение, эффект затухает, когда менее полезные образцы включаются в обучение. Это подтверждает эффективность активного обучения, но также показывает, что его польза ограничена и следует оценивать с учетом этих особенностей.

Abstract

This paper examines the effectiveness of combining active learning and transfer learning for anomaly detection in cross-domain time-series data. Our results indicate that there is an interaction between clustering and active learning and in general the best performance is achieved using a single cluster (in other words when clustering is not applied). Also, we find that adding new samples to the training set using active learning does improve model performance but that in general, the rate of improvement is slower than the results reported in the literature suggest. We attribute this difference to an improved experimental design where distinct data samples are used for the sampling and testing pools. Finally, we assess the ceiling performance of transfer learning in combination with active learning across several datasets and find that performance does initially improve but eventually begins to tail off as more target points are selected for inclusion in training. This tail-off in performance may indicate that the active learning process is doing a good job of sequencing data points for selection, pushing the less useful points towards the end of the selection process and that this tail-off occurs when these less useful points are eventually added. Taken together our results indicate that active learning is effective but that the improvement in model performance follows a linear flat function concerning the number of points selected and labelled.

Ссылки и действия