SpellerSSL: Self-Supervised Learning with P300 Aggregation for Speller BCIs
2509.19401v1
eess.SP, cs.LG
2025-09-26
Авторы:
Jiazhen Hong, Geoff Mackellar, Soheila Ghane
Резюме на русском
## Контекст
Применение EEG-базированных P300-спеллеров в brain-computer interfaces (BCI) становится все более актуальным в сфере нейротехнологий. Однако эти системы сталкиваются с несколькими проблемами, которые ограничивают их эффективность. Наиболее выдающимися проблемами являются низкая сигнал-шум отношение (SNR), ограниченная общительность моделей и долгий процесс калибровки. Эти ограничения приводят к невысокой точности распознавания и сложностям в применении в реальных условиях. Развитие методов, улучшающих эти аспекты, является ключевым мотивом для развития P300-спеллеров BCI.
## Метод
Мы предлагаем SpellerSSL, инновационный подход, который сочетает self-supervised learning (SSL) с P300 aggregation для улучшения BCI-систем. SSL позволяет извлекать значимые представления EEG-данных независимо от меток, что решает проблему нехватки меток в отладочных процессах. Для улучшения общительности мы разработали 1D U-Net архитектуру, которая способна обучаться как на cross-domain, так и на in-domain EEG данных. Для P300-распознавания мы применяем lightweight ERP-Head classifier, который адаптирует обученные представления к конкретному пользователю. Этот подход позволяет сочетать преимущества обучения на больших данных с учетом специфики каждого пользователя.
## Результаты
Мы оценили SpellerSSL на двух различных наборах данных: in-domain и cross-domain. В результате на in-domain данных SSL показал самую высокую информационную скорость передачи (ITR) в 21.86 bits/min при 7 повторениях, а также достиг 94% точности распознавания символов. Эти результаты существенно превосходят современные алгоритмы. Благодаря P300 aggregation, SSL также уменьшил требуемый объем калибровочных данных на 60%, при этом сохранив высокую точность распознавания. Эти результаты демонстрируют эффективность SSL в улучшении общительности и оперативности P300-спеллеров.
## Значимость
Предложенный подход имеет широкие перспективы в применении. Он может быть использован в задачах моделирования сигналов P300, а также в разработке BCI-систем для реабилитации инвалидов, управления роботами, или даже в системах самоуправляемых транспортных средств. Одним из ключевых преимуществ является сокращение времени калибровки, что повышает удобство использования для пользователей. Более того, SSL-подход может быть расширен для развития EEG foundation model, который будет универсальным и применяемым в различных BCI-системах.
## Выводы
SpellerSSL продемонстрировал свою эффективность в решении трех главных проблем P300-спеллеров BCI: низкого SNR, недостаточной общительности и долгого калибровочного процесса. Наш подход может стать основополагающим для развития систем, значительно улучшающ
Abstract
Electroencephalogram (EEG)-based P300 speller brain-computer interfaces
(BCIs) face three main challenges: low signal-to-noise ratio (SNR), poor
generalization, and time-consuming calibration. We propose SpellerSSL, a
framework that combines self-supervised learning (SSL) with P300 aggregation to
address these issues. First, we introduce an aggregation strategy to enhance
SNR. Second, to achieve generalization in training, we employ a customized 1D
U-Net backbone and pretrain the model on both cross-domain and in-domain EEG
data. The pretrained model is subsequently fine-tuned with a lightweight
ERP-Head classifier for P300 detection, which adapts the learned
representations to subject-specific data. Our evaluations on calibration time
demonstrate that combining the aggregation strategy with SSL significantly
reduces the calibration burden per subject and improves robustness across
subjects. Experimental results show that SSL learns effective EEG
representations in both in-domain and cross-domain, with in-domain achieving a
state-of-the-art character recognition rate of 94% with only 7 repetitions and
the highest information transfer rate (ITR) of 21.86 bits/min on the public
II-B dataset. Moreover, in-domain SSL with P300 aggregation reduces the
required calibration size by 60% while maintaining a comparable character
recognition rate. To the best of our knowledge, this is the first study to
apply SSL to P300 spellers, highlighting its potential to improve both
efficiency and generalization in speller BCIs and paving the way toward an EEG
foundation model for P300 speller BCIs.
Ссылки и действия
Дополнительные ресурсы: