CCE: Confidence-Consistency Evaluation for Time Series Anomaly Detection
2509.01098v1
cs.LG, cs.AI, stat.ML
2025-09-05
Авторы:
Zhijie Zhong, Zhiwen Yu, Yiu-ming Cheung, Kaixiang Yang
Резюме на русском
## Контекст
В области временных рядов, оценка моделей аномализации является критически важной задачей. Однако существующие метрики имеют недостатки: недостаточная дискриминативная сила, чувствительность к гиперпараметрам, восприимчивость дискрепантности данных и высокий компьютерный оверхед. Эти ограничения приводят к неточной оценке моделей и снижают надежность результатов. Наша мотивация заключается в разработке более стабильной и эффективной метрики, которая учитывает не только точность предсказаний, но и их уверенность и согласованность.
## Метод
Мы предлагаем метод **Confidence-Consistency Evaluation (CCE)**, который оценивает две стороны качества предсказаний: уверенность и согласованность. Для построения метрики CCE используется техника Байесовского вывода для оценки неопределенности аномалий. Мы строим "глобальную" и "событийную" оценки уверенности и согласованности, чтобы обеспечить полную картину качества модели. Это позволяет CCE быть компактной и ресурсосберегающей метрикой. Мы также применяем техники линейной алгебры и математической статистики для обеспечения робастности и эффективности.
## Результаты
Мы проводили эксперименты на различных датасетах, включающих данные с разными характеристиками (например, IoT, финансовые данные). Метрика CCE показала существенное улучшение в дискриминативности и устойчивости по сравнению с существующими метриками. Мы также провели тесты на систематической неточности и внешних помех, показав, что CCE лучше справляется с ними. Также, CCE доказала свою эффективность в быстрой оценке моделей при малом оверхеде вычислений.
## Значимость
Метрика CCE может применяться во многих областях, где важна точная оценка аномалий в временных рядах, такие как безопасность систем, финансовый мониторинг, интернет вещей. Она обеспечивает лучшую точность, устойчивость к помехам и эффективность. Благодаря RankEval, мы предложили первый стандартизированный процесс для сравнения различных метрик, что способствует повышению надежности исследований в этой области.
## Выводы
Мы предложили новую метрику CCE, которая предлагает сильные доказательства ее эффективности и устойчивости в оценке моделей аномализации временных рядов. Мы также интегрировали RankEval в качестве открытого стандарта для сравнения метрик. Будущие исследования будут фокусироваться на расширении CCE для более сложных моделей и приложений, а также на ее применении в реальных мировых задачах.
Abstract
Time Series Anomaly Detection metrics serve as crucial tools for model
evaluation. However, existing metrics suffer from several limitations:
insufficient discriminative power, strong hyperparameter dependency,
sensitivity to perturbations, and high computational overhead. This paper
introduces Confidence-Consistency Evaluation (CCE), a novel evaluation metric
that simultaneously measures prediction confidence and uncertainty consistency.
By employing Bayesian estimation to quantify the uncertainty of anomaly scores,
we construct both global and event-level confidence and consistency scores for
model predictions, resulting in a concise CCE metric. Theoretically and
experimentally, we demonstrate that CCE possesses strict boundedness, Lipschitz
robustness against score perturbations, and linear time complexity
$\mathcal{O}(n)$. Furthermore, we establish RankEval, a benchmark for comparing
the ranking capabilities of various metrics. RankEval represents the first
standardized and reproducible evaluation pipeline that enables objective
comparison of evaluation metrics. Both CCE and RankEval implementations are
fully open-source.
Ссылки и действия
Дополнительные ресурсы: