RDD: Pareto Analysis of the Rate-Distortion-Distinguishability Trade-off

2509.24805v1 eess.SP, cs.AI, cs.IT, math.IT 2025-10-01
Авторы:

Andriy Enttsel, Alex Marchioni, Andrea Zanellini, Mauro Mangia, Gianluca Setti, Riccardo Rovatti

Резюме на русском

## Контекст В последние годы системы мониторинга, такие как радиочастотные системы и системы наблюдения за энергоснабжением, становятся все более распространенными. Эти системы собирают большие объемы данных, которые последующим образом сокращаются для передачи по сети. Затем эти сжатые данные обрабатываются в облаке для выполнения задач, таких как обнаружение аномалий. Однако сжатие может привести к потере информации, что снижает возможности сетевого детектора различать шаблоны нормальной и аномальной деятельности. Это создает проблему для системы, которая должна быть одновременно эффективной в сжатии, ограничивающая расход ресурсов, и точной в распознавании аномалий. Необходимо выработать подход, который привлечет внимание к всем трем этим аспектам: эффективности сжатия, распространенности дисторсии и различимости результатов. ## Метод Для решения этой проблемы расширяется информационно-теоретический подход, представленный в [1]. Этот метод описывает торговлю между тремя функциональными взаимосвязанными параметрами: эффективностью сжатия, уровнем распространенной дисторсии и различимостью результатов детектора. Используя нормальное распределение для моделирования сигналов, авторы предлагают графическое представление, называемое Pareto-поверхностью, которое позволяет понять, как эти факторы взаимодействуют. Этот подход предлагает более гибкий и управляемый вариант сжатия, чем простое применение оптимальных алгоритмов сжатия, надеясь на различимость результатов. ## Результаты Используя эксперименты на реальных данных, авторы показывают, что рекомендуемый подход эффективен в управлении тремя факторами. Эксперименты включают сравнение результатов при использовании различных стратегий сжатия, включая оптимальные алгоритмы сжатия. Результаты показывают, что Pareto-поверхность позволяет достичь более оптимального баланса между эффективностью сжатия и точностью распознавания аномалий. Также продемонстрировано, что во время сжатия значительно меньше данных потеряны, чем при оптимальном сжатии, что приводит к лучшей распространенности дисторсии и выигрышу в различимости. ## Значимость Предлагаемый подход может быть применен в различных областях, таких как мониторинг энергосистем, системы безопасности и системы мониторинга здравоохранения. С помощью этого подхода можно повысить эффективность сжатия без потери важной информации, что значительно улучшает работу детекторов аномалий. Это приведет к уменьшению потерь данных и высокой точности распознавания. Э

Abstract

Extensive monitoring systems generate data that is usually compressed for network transmission. This compressed data might then be processed in the cloud for tasks such as anomaly detection. However, compression can potentially impair the detector's ability to distinguish between regular and irregular patterns due to information loss. Here we extend the information-theoretic framework introduced in [1] to simultaneously address the trade-off between the three features on which the effectiveness of the system depends: the effectiveness of compression, the amount of distortion it introduces, and the distinguishability between compressed normal signals and compressed anomalous signals. We leverage a Gaussian assumption to draw curves showing how moving on a Pareto surface helps administer such a trade-off better than simply relying on optimal rate-distortion compression and hoping that compressed signals can be distinguished from each other.

Ссылки и действия