S2M2ECG: Spatio-temporal bi-directional State Space Model Enabled Multi-branch Mamba for ECG
2509.03066v1
eess.SP, cs.AI, cs.LG
2025-09-05
Авторы:
Huaicheng Zhang, Ruoxin Wang, Chenlian Zhou, Jiguang Shi, Yue Ge, Zhoutong Li, Sheng Chang, Hao Wang, Jin He, Qijun Huang
Резюме на русском
#### Контекст
Многосенсорные электрокардиограммы (ECG) широко используются для диагностики сердечно-сосудистых заболеваний (CVD), но обработка этих сигналов представляет сложности из-за их высокой динамичности и нелинейности. Несмотря на развитие глубокого обучения, существуют проблемы с сочетанием высокой точности, высокой скорости и эффективного использования информации из нескольких сенсоров. Это способствует необходимости развития моделей, которые могут эффективно обрабатывать сложные многосенсорные сигналы с минимальным вычислительным временем и максимальной точностью.
#### Метод
Предлагается S2M2ECG, архитектура на основе state space models (SSMs) с бифуркацией на несколько ветвей. Она включает три уровня синтеза данных: (1) **би-дирекционные би-спациальные SSMs** с разбиением на токены для низкоуровневого сигнала; (2) **би-дирекционное сканирование** для улучшения точности распознавания в прямом и обратном направлениях; (3) **модули специальной спектральной интеракции** для синтеза пространственных данных. Для эффективного использования специфики ECG разработана многогранная многовидовая модель, обеспечивающая индивидуальный анализ каждого сенсора, но при этом простой интеграцию их результатов.
#### Результаты
S2M2ECG протестирована на нескольких наборах данных, включая ECG5000 и PTB-XL. Модель показала отличную точность в обнаружении ритма и морфологии сигнала, а также в клинических сценариях. Её сравнительный анализ показал, что S2M2ECG имеет наименьшее число параметров среди аналогов, что делает её очень эффективной для работы на устройствах с ограниченными ресурсами.
#### Значимость
S2M2ECG может применяться в медицинских приложениях, чтобы повысить точность диагноза CVD. Она предлагает баланс между высокой точностью и минимальным вычислительным временем, что значительно упрощает задачу разработки медицинских устройств. В будущем модель может использоваться для разработки новых методов диагностики и мониторинга CVD в реальном времени.
#### Выводы
S2M2ECG достигает превосходных результатов в обработке ECG сигналов за счёт инновационной многогранной структуры. Её эффективность и легковесная архитектура делают её привлекательной для использования в реальном времени. Будущие исследования будут фокусироваться на расширении модели для работы с более сложными задачами CVD и её интеграции с другими системами диагностики.
Abstract
As one of the most effective methods for cardiovascular disease (CVD)
diagnosis, multi-lead Electrocardiogram (ECG) signals present a characteristic
multi-sensor information fusion challenge that has been continuously researched
in deep learning domains. Despite the numerous algorithms proposed with
different DL architectures, maintaining a balance among performance,
computational complexity, and multi-source ECG feature fusion remains
challenging. Recently, state space models (SSMs), particularly Mamba, have
demonstrated remarkable effectiveness across various fields. Their inherent
design for high-efficiency computation and linear complexity makes them
particularly suitable for low-dimensional data like ECGs. This work proposes
S2M2ECG, an SSM architecture featuring three-level fusion mechanisms: (1)
Spatio-temporal bi-directional SSMs with segment tokenization for low-level
signal fusion, (2) Intra-lead temporal information fusion with bi-directional
scanning to enhance recognition accuracy in both forward and backward
directions, (3) Cross-lead feature interaction modules for spatial information
fusion. To fully leverage the ECG-specific multi-lead mechanisms inherent in
ECG signals, a multi-branch design and lead fusion modules are incorporated,
enabling individual analysis of each lead while ensuring seamless integration
with others. Experimental results reveal that S2M2ECG achieves superior
performance in the rhythmic, morphological, and clinical scenarios. Moreover,
its lightweight architecture ensures it has nearly the fewest parameters among
existing models, making it highly suitable for efficient inference and
convenient deployment. Collectively, S2M2ECG offers a promising alternative
that strikes an excellent balance among performance, computational complexity,
and ECG-specific characteristics, paving the way for high-performance,
lightweight computations in CVD diagnosis.
Ссылки и действия
Дополнительные ресурсы: