S2M2ECG: Spatio-temporal bi-directional State Space Model Enabled Multi-branch Mamba for ECG

2509.03066v1 eess.SP, cs.AI, cs.LG 2025-09-05
Авторы:

Huaicheng Zhang, Ruoxin Wang, Chenlian Zhou, Jiguang Shi, Yue Ge, Zhoutong Li, Sheng Chang, Hao Wang, Jin He, Qijun Huang

Резюме на русском

#### Контекст Многосенсорные электрокардиограммы (ECG) широко используются для диагностики сердечно-сосудистых заболеваний (CVD), но обработка этих сигналов представляет сложности из-за их высокой динамичности и нелинейности. Несмотря на развитие глубокого обучения, существуют проблемы с сочетанием высокой точности, высокой скорости и эффективного использования информации из нескольких сенсоров. Это способствует необходимости развития моделей, которые могут эффективно обрабатывать сложные многосенсорные сигналы с минимальным вычислительным временем и максимальной точностью. #### Метод Предлагается S2M2ECG, архитектура на основе state space models (SSMs) с бифуркацией на несколько ветвей. Она включает три уровня синтеза данных: (1) **би-дирекционные би-спациальные SSMs** с разбиением на токены для низкоуровневого сигнала; (2) **би-дирекционное сканирование** для улучшения точности распознавания в прямом и обратном направлениях; (3) **модули специальной спектральной интеракции** для синтеза пространственных данных. Для эффективного использования специфики ECG разработана многогранная многовидовая модель, обеспечивающая индивидуальный анализ каждого сенсора, но при этом простой интеграцию их результатов. #### Результаты S2M2ECG протестирована на нескольких наборах данных, включая ECG5000 и PTB-XL. Модель показала отличную точность в обнаружении ритма и морфологии сигнала, а также в клинических сценариях. Её сравнительный анализ показал, что S2M2ECG имеет наименьшее число параметров среди аналогов, что делает её очень эффективной для работы на устройствах с ограниченными ресурсами. #### Значимость S2M2ECG может применяться в медицинских приложениях, чтобы повысить точность диагноза CVD. Она предлагает баланс между высокой точностью и минимальным вычислительным временем, что значительно упрощает задачу разработки медицинских устройств. В будущем модель может использоваться для разработки новых методов диагностики и мониторинга CVD в реальном времени. #### Выводы S2M2ECG достигает превосходных результатов в обработке ECG сигналов за счёт инновационной многогранной структуры. Её эффективность и легковесная архитектура делают её привлекательной для использования в реальном времени. Будущие исследования будут фокусироваться на расширении модели для работы с более сложными задачами CVD и её интеграции с другими системами диагностики.

Abstract

As one of the most effective methods for cardiovascular disease (CVD) diagnosis, multi-lead Electrocardiogram (ECG) signals present a characteristic multi-sensor information fusion challenge that has been continuously researched in deep learning domains. Despite the numerous algorithms proposed with different DL architectures, maintaining a balance among performance, computational complexity, and multi-source ECG feature fusion remains challenging. Recently, state space models (SSMs), particularly Mamba, have demonstrated remarkable effectiveness across various fields. Their inherent design for high-efficiency computation and linear complexity makes them particularly suitable for low-dimensional data like ECGs. This work proposes S2M2ECG, an SSM architecture featuring three-level fusion mechanisms: (1) Spatio-temporal bi-directional SSMs with segment tokenization for low-level signal fusion, (2) Intra-lead temporal information fusion with bi-directional scanning to enhance recognition accuracy in both forward and backward directions, (3) Cross-lead feature interaction modules for spatial information fusion. To fully leverage the ECG-specific multi-lead mechanisms inherent in ECG signals, a multi-branch design and lead fusion modules are incorporated, enabling individual analysis of each lead while ensuring seamless integration with others. Experimental results reveal that S2M2ECG achieves superior performance in the rhythmic, morphological, and clinical scenarios. Moreover, its lightweight architecture ensures it has nearly the fewest parameters among existing models, making it highly suitable for efficient inference and convenient deployment. Collectively, S2M2ECG offers a promising alternative that strikes an excellent balance among performance, computational complexity, and ECG-specific characteristics, paving the way for high-performance, lightweight computations in CVD diagnosis.

Ссылки и действия