Active Learning and Transfer Learning for Anomaly Detection in Time-Series Data
2508.03921v1
cs.LG, cs.AI
2025-08-09
Авторы:
John D. Kelleher, Matthew Nicholson, Rahul Agrahari, Clare Conran
Резюме на русском
**Резюме**
В статье рассматривается эффективность сочетания активного обучения (active learning) и трансферного обучения (transfer learning) для обнаружения аномалий в временных рядах. Авторы исследовали, в какой степени эти подходы могут улучшить модели детектирования аномалий при работе с кросс-доменными данными. Основные находки указывают на то, что сочетание активного и трансферного обучения может улучшить производительность моделей, однако производительность лучше всего достигается при использовании одного кластера, то есть без применения кластеризации. Также было обнаружено, что добавление новых выборок с помощью активного обучения повышает качество модели, хотя темп улучшения менее заметен, чем в предыдущих работах, возможно из-за более точного экспериментального дизайна. Наконец, авторы оценили потенциальную высокую производительность трансферного обучения в сочетании с активным обучением и заметили, что хотя модель показывает исходное улучшение, эффект затухает, когда менее полезные образцы включаются в обучение. Это подтверждает эффективность активного обучения, но также показывает, что его польза ограничена и следует оценивать с учетом этих особенностей.
Abstract
This paper examines the effectiveness of combining active learning and
transfer learning for anomaly detection in cross-domain time-series data. Our
results indicate that there is an interaction between clustering and active
learning and in general the best performance is achieved using a single cluster
(in other words when clustering is not applied). Also, we find that adding new
samples to the training set using active learning does improve model
performance but that in general, the rate of improvement is slower than the
results reported in the literature suggest. We attribute this difference to an
improved experimental design where distinct data samples are used for the
sampling and testing pools. Finally, we assess the ceiling performance of
transfer learning in combination with active learning across several datasets
and find that performance does initially improve but eventually begins to tail
off as more target points are selected for inclusion in training. This tail-off
in performance may indicate that the active learning process is doing a good
job of sequencing data points for selection, pushing the less useful points
towards the end of the selection process and that this tail-off occurs when
these less useful points are eventually added. Taken together our results
indicate that active learning is effective but that the improvement in model
performance follows a linear flat function concerning the number of points
selected and labelled.
Ссылки и действия
Дополнительные ресурсы: