PySeizure: A single machine learning classifier framework to detect seizures in diverse datasets
2508.07253v1
cs.LG, eess.SP, q-bio.NC
2025-08-13
Авторы:
Bartlomiej Chybowski, Shima Abdullateef, Hollan Haule, Alfredo Gonzalez-Sulser, Javier Escudero
Резюме на русском
#### Контекст
Эффективное обнаружение судорог является ключевым аспектом диагностики и контроля эпилепсии. Однако клинические процессы до сих пор основываются на временно-затратной и дорогостоящей методике — ручном интерпретировании электроэнцефалограмм (EEG). Использование машинного обучения для решения этой задачи привлекало внимание в последние годы, но большинство существующих подходов ориентированы на конкретные данные и структуры датасетов, что ограничивает их общую применимость и повторяемость. Наша цель — разработать универсальную и открытую модель, которая обеспечивает надежный и реплицируемый судорожный анализ в различных клинических условиях.
#### Метод
Мы предлагаем PySeizure — мощный, гибкий и открытый фреймворк для обнаружения судорог. Методология основывается на нейронных сетях, которые обрабатывают сигналы EEG и выявляют сигналы судорог. Для обеспечения высокой точности мы внедрили автоматизированный предварительный процесс, который нормализует данные и устраняет их различия. Для повышения надежности включен механизм "велпотростовского голосования", при котором несколько моделей анализируют каждый секундный фрагмент EEG, и решение принимается коллективно. Мы оценивали модели на двух открытых датасетах (CHB-MIT и TUSZ), которые отличаются выборочной структурой и конфигурацией электродов. Мы сравнили внутридатасетную и кросс-датасетную точность моделей, а также исследовали значение дополнительной пост-обработки.
#### Результаты
Предложенная модель показала высокую точность в определении судорог в рамках каждого отдельного датасета: AUC 0.904 ± 0.059 для CHB-MIT и 0.864 ± 0.060 для TUSZ. Она также продемонстрировала значительную общую применимость, даже при различиях в подготовке данных и профилях пациентов: AUC 0.615 ± 0.039 (CHB-MIT на TUSZ) и 0.762 ± 0.175 (TUSZ на CHB-MIT). Дополнительная пост-обработка улучшила эти результаты до 0.913 ± 0.064 и 0.867 ± 0.058 для внутридатасетного анализа и до 0.619 ± 0.036 и 0.768 ± 0.172 для кросс-датасетного.
#### Значимость
Модель PySeizure может быть применена в разнообразных клинических условиях, что позволяет улучшить диагностические процессы. Она обеспечивает высокую точность и гибкость, не зависит от конкретного датасета и может быть интегрирована с клиническими системами для повышения эффективности. Мы также открыли исходный код, что позволяет другим исследователям проводить эксперименты и расширять функциональность.
#### Выводы
Результаты показывают, что PySeizure является выгодной альтернативой традиционным методам обна
Abstract
Reliable seizure detection is critical for diagnosing and managing epilepsy,
yet clinical workflows remain dependent on time-consuming manual EEG
interpretation. While machine learning has shown promise, existing approaches
often rely on dataset-specific optimisations, limiting their real-world
applicability and reproducibility. Here, we introduce an innovative,
open-source machine-learning framework that enables robust and generalisable
seizure detection across varied clinical datasets. We evaluate our approach on
two publicly available EEG datasets that differ in patient populations and
electrode configurations. To enhance robustness, the framework incorporates an
automated pre-processing pipeline to standardise data and a majority voting
mechanism, in which multiple models independently assess each second of EEG
before reaching a final decision. We train, tune, and evaluate models within
each dataset, assessing their cross-dataset transferability. Our models achieve
high within-dataset performance (AUC 0.904+/-0.059 for CHB-MIT and
0.864+/-0.060 for TUSZ) and demonstrate strong generalisation across datasets
despite differences in EEG setups and populations (AUC 0.615+/-0.039 for models
trained on CHB-MIT and tested on TUSZ and 0.762+/-0.175 in the reverse case)
without any post-processing. Furthermore, a mild post-processing improved the
within-dataset results to 0.913+/-0.064 and 0.867+/-0.058 and cross-dataset
results to 0.619+/-0.036 and 0.768+/-0.172. These results underscore the
potential of, and essential considerations for, deploying our framework in
diverse clinical settings. By making our methodology fully reproducible, we
provide a foundation for advancing clinically viable, dataset-agnostic seizure
detection systems. This approach has the potential for widespread adoption,
complementing rather than replacing expert interpretation, and accelerating
clinical integration.