Adaptive Segmentation of EEG for Machine Learning Applications
2508.20336v1
cs.LG, eess.SP, q-bio.NC
2025-08-29
Авторы:
Johnson Zhou, Joseph West, Krista A. Ehinger, Zhenming Ren, Sam E. John, David B. Grayden
Резюме на русском
## Контекст
Электроэнцефалограмма (EEG) представляет собой непрерывные значения, отражающие электрическую активность мозга. Для подготовки EEG-данных к анализу с помощью машинного обучения необходимо разбить непрерывный сигнал на отдельные сегменты. Обычно для этого используют простую схему с фиксированными сегментами, независимо от биологической релевантности такого разделения. Это приводит к ограниченной точности при анализе, так как EEG-сигналы выражены в биологических состояниях, которые не являются статичными и не ограниченными временными интервалами. Целью нашего исследования является рассмотрение адаптивных методов сегментации, которые могут более точно отражать биологические состояния, обеспечивая улучшенную точность в машинном обучении.
## Метод
Мы представляем CTXSEG — новую адаптивную методику сегментации, которая разбивает EEG-сигналы на переменностоящие сегменты на основе статистических отличий в данных. Мы адаптируем данные для использования в современных машинных обучаемых системах, требующих фиксированного размера входных данных. Для эффективного проверки CTXSEG, мы разработали CTXGEN — синтетический генератор сигналов, дающий управляемые данные для экспериментов. Также, мы использовали реальные EEG-данные, ориентированные на задачу детектирования судорог, для подтверждения эффективности наших решений. Мы сравнивали CTXSEG с традиционными методами сегментации с фиксированным размером на основе валидационных фреймворков.
## Результаты
Наши результаты показали, что CTXSEG значительно повышает эффективность детектирования судорог в сравнении с фиксированными сегментами. Данный подход позволяет получить более точные результаты, не требуя изменений в машинном обучении. Мы также обнаружили, что CTXSEG требует меньшего количества сегментов для достижения того же уровня производительности, чем обычные методы сегментации.
## Значимость
Наш подход может быть использован в различных приложениях машинного обучения, которые основываются на EEG-данных. Он предоставляет более точные и надежные средства для предварительной обработки данных, способствуя повышению точности в задачах, таких как детектирование судорог. Использование CTXSEG может стать новым стандартом в сегментации EEG для машинного обучения, в связи с его универсальностью и производительностью.
## Выводы
Мы доказали, что адаптивная сегментация с CTXSEG может весьма эффективно повысить результаты машинного обучения в задачах, использующих EEG-данные. Мы рекомендуем использовать CTXSEG в качестве нового стандарта для сегментации EEG в предварительной обработке данных.
Abstract
Objective. Electroencephalography (EEG) data is derived by sampling
continuous neurological time series signals. In order to prepare EEG signals
for machine learning, the signal must be divided into manageable segments. The
current naive approach uses arbitrary fixed time slices, which may have limited
biological relevance because brain states are not confined to fixed intervals.
We investigate whether adaptive segmentation methods are beneficial for machine
learning EEG analysis.
Approach. We introduce a novel adaptive segmentation method, CTXSEG, that
creates variable-length segments based on statistical differences in the EEG
data and propose ways to use them with modern machine learning approaches that
typically require fixed-length input. We assess CTXSEG using controllable
synthetic data generated by our novel signal generator CTXGEN. While our CTXSEG
method has general utility, we validate it on a real-world use case by applying
it to an EEG seizure detection problem. We compare the performance of CTXSEG
with fixed-length segmentation in the preprocessing step of a typical EEG
machine learning pipeline for seizure detection.
Main results. We found that using CTXSEG to prepare EEG data improves seizure
detection performance compared to fixed-length approaches when evaluated using
a standardized framework, without modifying the machine learning method, and
requires fewer segments.
Significance. This work demonstrates that adaptive segmentation with CTXSEG
can be readily applied to modern machine learning approaches, with potential to
improve performance. It is a promising alternative to fixed-length segmentation
for signal preprocessing and should be considered as part of the standard
preprocessing repertoire in EEG machine learning applications.