PTSM: Physiology-aware and Task-invariant Spatio-temporal Modeling for Cross-Subject EEG Decoding

2508.11357v1 cs.LG, cs.AI 2025-08-19
Авторы:

Changhong Jing, Yan Liu, Shuqiang Wang, Bruce X. B. Yu, Gong Chen, Zhejing Hu, Zhi Zhang, Yanyan Shen

Резюме на русском

#### Контекст Электроэнцефалограмма (EEG) — важный инструмент в области мониторинга нейрофизиологических процессов и интеллектуальных технологий. Однако, применение EEG в системах Brain-Computer Interface (BCI) сталкивается с значительными вызовами, в том числе существенной индивидуальной различием (inter-subject variability) и недостатком представительных репрезентаций, которые могут быть эффективно использованы в кросс-субъектной моделировании. Нехватка эффективных методов, позволяющих выделить инвариантные для всех пользователей задачи, затрудняет получение точных и переносимых результатов. Мотивация для данного исследования заключается в развитии методов, которые могут обеспечить интерпретируемость и надежность моделей для кросс-субъектного EEG-декодирования, учитывая особенности нейрофизиологической активности каждого пользователя. #### Метод PTSM (Physiology-aware and Task-invariant Spatio-temporal Modeling) представляет собой инновационный подход к моделированию нейрофизиологических сигналов. Он включает **двух ветвленную механизм масок**, который отдельно учитывает персонализированные и общие (для всех субъектов) характеристики спектро-временных фрагментов сигнала. Эти маски используются для модификации значимых слоев нейронной сети, позволяя удерживать индивидуальные особенности, такие как расположение электродов и нейропатологии, при этом извлекая общие для задачи признаки. Более того, PTSM внедряет информационно-теоретические ограничения, разделяющие представления в независимые подпространства, относящиеся к задаче и к субъекту. Это позволяет сократить кросс-субъектные ошибки и улучшить общую точность модели. Модель тренируется с помощью многообъективного подхода, который позволяет максимизировать точность классификации, поддерживать контрастные представления, и обеспечивать разделение персонализированных и общих признаков. #### Результаты Для оценки PTSM, авторы проводили исследования на нескольких многоперсоновых датасетах, связанных с задачей кросс-субъектного моторного воображения. При сравнении с состоянием технологии, PTSM показал существенное улучшение в перекрестном декодировании, подтвердив свою способность достигать значительного улучшения в переносимости и точности. Благодаря дисентгалированным представлениям, PTSM обеспечивает высокую гибкость в моделировании нерегулярных и нестационарных нейрофизиологических сигналов. Эксперименты показали, что PTSM способен обеспечить нулевую-темпу обучения и превосходить существующие методы в задаче переносимости. #### Значимость Предложенный подход PTSM имеет широкие перспективы применения в об

Abstract

Cross-subject electroencephalography (EEG) decoding remains a fundamental challenge in brain-computer interface (BCI) research due to substantial inter-subject variability and the scarcity of subject-invariant representations. This paper proposed PTSM (Physiology-aware and Task-invariant Spatio-temporal Modeling), a novel framework for interpretable and robust EEG decoding across unseen subjects. PTSM employs a dual-branch masking mechanism that independently learns personalized and shared spatio-temporal patterns, enabling the model to preserve individual-specific neural characteristics while extracting task-relevant, population-shared features. The masks are factorized across temporal and spatial dimensions, allowing fine-grained modulation of dynamic EEG patterns with low computational overhead. To further address representational entanglement, PTSM enforces information-theoretic constraints that decompose latent embeddings into orthogonal task-related and subject-related subspaces. The model is trained end-to-end via a multi-objective loss integrating classification, contrastive, and disentanglement objectives. Extensive experiments on cross-subject motor imagery datasets demonstrate that PTSM achieves strong zero-shot generalization, outperforming state-of-the-art baselines without subject-specific calibration. Results highlight the efficacy of disentangled neural representations for achieving both personalized and transferable decoding in non-stationary neurophysiological settings.

Ссылки и действия