PRISM: Lightweight Multivariate Time-Series Classification through Symmetric Multi-Resolution Convolutional Layers
2508.04503v1
cs.LG, cs.AI
2025-08-09
Авторы:
Federico Zucchi, Thomas Lampert
Резюме на русском
## КОНТЕКСТ И ПРОБЛЕМАТИКА
Многомерная классификация временных рядов (Multivariate Time-Series Classification, MTSC) является ключевой задачей в таких областях, как износостойкие датчики, мониторинг биомедицинских данных и другие приложения, требующие анализа комплексных данных во временном контексте. Несмотря на значительные успехи в этой области, существующие подходы сталкиваются с некоторыми серьезными ограничениями. Модели на основе трансформеров (Transformers) и сверточных нейронных сетей (Convolutional Neural Networks, CNNs), хоть и достигли высоких результатов в классификации, часто характеризуются высокой вычислительной сложностью, требуют больших параметрических ресурсов и имеют ограниченную способность к анализу частотных компонент временных рядов. Эти недостатки делают их менее пригодными для приложений, где важна эффективность ресурсов и возможность работы на ограниченной вычислительной мощности.
Кроме того, существующие модели обычно не учитывают многоуровневую природу временных рядов, где различные частотные компоненты могут быть важны на разных временных масштабах. Это ограничение может приводить к потере важной информации при классификации. Таким образом, необходимо разработать новый подход, который сочетает в себе высокую точность классификации и низкую вычислительную сложность, а также учитывает многоуровневую природу данных.
## ПРЕДЛОЖЕННЫЙ МЕТОД
Предлагается новый метод под названием PRISM (Per-channel Resolution-Informed Symmetric Module) для классификации многомерных временных рядов. PRISM основывается на использовании симметричных конечно-импульсных фильтров (Finite-Impulse Response, FIR), применяемых на нескольких временных масштабах для каждого канала независимо. Этот подход позволяет получать высокочастотно-селективные эмбеддинги (embeddings) без необходимости выполнения межканальных сверток, что существенно сокращает размер модели и ее вычислительную сложность.
Ключевой идеей PRISM является применение фильтров FIR на разных временных масштабах для каждого канала, что позволяет эффективно извлекать информацию о частотных характеристиках данных. Эти фильтры работают независимо для каждого канала, что позволяет сохранить их специфические частотные характеристики. Такой подход обеспечивает лучшую интерпретируемость модели и позволяет эффективно работать с различными типами данных.
Архитектура PRISM состоит из нескольких симметричных модулей, каждый из которых обрабатывает входные данные на разных временных масштабах. Эти модули соединены в серию, что позволяет получать многоуровневую представление данных. Кроме того, PRISM использует легковесные классификационные модули, что дает дополнительный прирост в эффективности.
## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ
Для оценки эффективности метода PRISM были проведены эксперименты на нескольких наборах данных, включая Human Activity Recognition (HAR), Sleep-Stage Classification и Biomedical Data. Эти данные представляют собой многомерные временные ряды с различными характеристиками. PRISM был сравнен с несколькими современными методами, включая CNN- и Transformer-based модели.
Результаты экспериментов показали, что PRISM достигает точности классификации, сопоставимой с современными моделями, но с значительно меньшим количеством параметров и вычислительных операций (FLOPs). В частности, PRISM использует примерно на порядок меньше параметров и вычислительных ресурсов по сравнению с трансформером и CNN-based моделями. Это демонстрирует высокую эффективность PRISM в решении задачи классификации многомерных временных рядов.
## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ
Предлагаемый метод PRISM имеет широкое применение в различных областях, требующих классификацию многомерных временных рядов. Например, в биомедицинской области, PRISM может быть использован для мониторинга состояния пациентов, анализа данных, полученных от износостойких датчиков, или для классификации этапов сна. Благодаря своей низкой вычислительной сложности и высокой точности, PRISM может быть внедрен на мобильных устройствах или IoT-устройствах, где ограничены вычислительные ресурсы.
Кроме того, PRISM может быть использован в таких областях, как мониторинг физической активности, анализ электрокардиограмм (ECG) и другие приложения, требующие анализа временных рядов. Его эффективность и малогабаритность делают его пригодным для использования в реальных условиях, где важна энергоэффективность и высокая точность классификации.
## ВЫВОДЫ И ПЕРСПЕКТИВЫ
В работе представлен метод PRISM, который сочетает в себе классические подходы к обработке сигналов с современными методами глубокого обучения. PRISM показывает высокую точность классификации многомерных временных рядов при значительно меньших ресурсах по сравнению с современными моделями. Это открывает новые возможности для применения в реальных условиях, где важна эффективность ресурсов.
Будущие исследования могут фокусироваться на дальнейшем улучшении PRISM, включая его адаптацию для работы с более сложными временными рядами или для использования в реальном времени. Кроме того, можно исследовать возможность интеграции PRISM с другими моделями или методами обработки данных для повышения его эффективности.
Abstract
Multivariate time-series classification is pivotal in domains ranging from
wearable sensing to biomedical monitoring. Despite recent advances,
Transformer- and CNN-based models often remain computationally heavy, offer
limited frequency diversity, and require extensive parameter budgets. We
propose PRISM (Per-channel Resolution-Informed Symmetric Module), a
convolutional-based feature extractor that applies symmetric
finite-impulse-response (FIR) filters at multiple temporal scales,
independently per channel. This multi-resolution, per-channel design yields
highly frequency-selective embeddings without any inter-channel convolutions,
greatly reducing model size and complexity. Across human-activity, sleep-stage
and biomedical benchmarks, PRISM, paired with lightweight classification heads,
matches or outperforms leading CNN and Transformer baselines, while using
roughly an order of magnitude fewer parameters and FLOPs. By uniting classical
signal processing insights with modern deep learning, PRISM offers an accurate,
resource-efficient solution for multivariate time-series classification.
Ссылки и действия
Дополнительные ресурсы: