PTSM: Physiology-aware and Task-invariant Spatio-temporal Modeling for Cross-Subject EEG Decoding
2508.11357v1
cs.LG, cs.AI
2025-08-19
Авторы:
Changhong Jing, Yan Liu, Shuqiang Wang, Bruce X. B. Yu, Gong Chen, Zhejing Hu, Zhi Zhang, Yanyan Shen
Резюме на русском
#### Контекст
Электроэнцефалограмма (EEG) — важный инструмент в области мониторинга нейрофизиологических процессов и интеллектуальных технологий. Однако, применение EEG в системах Brain-Computer Interface (BCI) сталкивается с значительными вызовами, в том числе существенной индивидуальной различием (inter-subject variability) и недостатком представительных репрезентаций, которые могут быть эффективно использованы в кросс-субъектной моделировании. Нехватка эффективных методов, позволяющих выделить инвариантные для всех пользователей задачи, затрудняет получение точных и переносимых результатов. Мотивация для данного исследования заключается в развитии методов, которые могут обеспечить интерпретируемость и надежность моделей для кросс-субъектного EEG-декодирования, учитывая особенности нейрофизиологической активности каждого пользователя.
#### Метод
PTSM (Physiology-aware and Task-invariant Spatio-temporal Modeling) представляет собой инновационный подход к моделированию нейрофизиологических сигналов. Он включает **двух ветвленную механизм масок**, который отдельно учитывает персонализированные и общие (для всех субъектов) характеристики спектро-временных фрагментов сигнала. Эти маски используются для модификации значимых слоев нейронной сети, позволяя удерживать индивидуальные особенности, такие как расположение электродов и нейропатологии, при этом извлекая общие для задачи признаки. Более того, PTSM внедряет информационно-теоретические ограничения, разделяющие представления в независимые подпространства, относящиеся к задаче и к субъекту. Это позволяет сократить кросс-субъектные ошибки и улучшить общую точность модели. Модель тренируется с помощью многообъективного подхода, который позволяет максимизировать точность классификации, поддерживать контрастные представления, и обеспечивать разделение персонализированных и общих признаков.
#### Результаты
Для оценки PTSM, авторы проводили исследования на нескольких многоперсоновых датасетах, связанных с задачей кросс-субъектного моторного воображения. При сравнении с состоянием технологии, PTSM показал существенное улучшение в перекрестном декодировании, подтвердив свою способность достигать значительного улучшения в переносимости и точности. Благодаря дисентгалированным представлениям, PTSM обеспечивает высокую гибкость в моделировании нерегулярных и нестационарных нейрофизиологических сигналов. Эксперименты показали, что PTSM способен обеспечить нулевую-темпу обучения и превосходить существующие методы в задаче переносимости.
#### Значимость
Предложенный подход PTSM имеет широкие перспективы применения в об
Abstract
Cross-subject electroencephalography (EEG) decoding remains a fundamental
challenge in brain-computer interface (BCI) research due to substantial
inter-subject variability and the scarcity of subject-invariant
representations. This paper proposed PTSM (Physiology-aware and Task-invariant
Spatio-temporal Modeling), a novel framework for interpretable and robust EEG
decoding across unseen subjects. PTSM employs a dual-branch masking mechanism
that independently learns personalized and shared spatio-temporal patterns,
enabling the model to preserve individual-specific neural characteristics while
extracting task-relevant, population-shared features. The masks are factorized
across temporal and spatial dimensions, allowing fine-grained modulation of
dynamic EEG patterns with low computational overhead. To further address
representational entanglement, PTSM enforces information-theoretic constraints
that decompose latent embeddings into orthogonal task-related and
subject-related subspaces. The model is trained end-to-end via a
multi-objective loss integrating classification, contrastive, and
disentanglement objectives. Extensive experiments on cross-subject motor
imagery datasets demonstrate that PTSM achieves strong zero-shot
generalization, outperforming state-of-the-art baselines without
subject-specific calibration. Results highlight the efficacy of disentangled
neural representations for achieving both personalized and transferable
decoding in non-stationary neurophysiological settings.
Ссылки и действия
Дополнительные ресурсы: