PySeizure: A single machine learning classifier framework to detect seizures in diverse datasets

2508.07253v1 cs.LG, eess.SP, q-bio.NC 2025-08-13
Авторы:

Bartlomiej Chybowski, Shima Abdullateef, Hollan Haule, Alfredo Gonzalez-Sulser, Javier Escudero

Резюме на русском

#### Контекст Эффективное обнаружение судорог является ключевым аспектом диагностики и контроля эпилепсии. Однако клинические процессы до сих пор основываются на временно-затратной и дорогостоящей методике — ручном интерпретировании электроэнцефалограмм (EEG). Использование машинного обучения для решения этой задачи привлекало внимание в последние годы, но большинство существующих подходов ориентированы на конкретные данные и структуры датасетов, что ограничивает их общую применимость и повторяемость. Наша цель — разработать универсальную и открытую модель, которая обеспечивает надежный и реплицируемый судорожный анализ в различных клинических условиях. #### Метод Мы предлагаем PySeizure — мощный, гибкий и открытый фреймворк для обнаружения судорог. Методология основывается на нейронных сетях, которые обрабатывают сигналы EEG и выявляют сигналы судорог. Для обеспечения высокой точности мы внедрили автоматизированный предварительный процесс, который нормализует данные и устраняет их различия. Для повышения надежности включен механизм "велпотростовского голосования", при котором несколько моделей анализируют каждый секундный фрагмент EEG, и решение принимается коллективно. Мы оценивали модели на двух открытых датасетах (CHB-MIT и TUSZ), которые отличаются выборочной структурой и конфигурацией электродов. Мы сравнили внутридатасетную и кросс-датасетную точность моделей, а также исследовали значение дополнительной пост-обработки. #### Результаты Предложенная модель показала высокую точность в определении судорог в рамках каждого отдельного датасета: AUC 0.904 ± 0.059 для CHB-MIT и 0.864 ± 0.060 для TUSZ. Она также продемонстрировала значительную общую применимость, даже при различиях в подготовке данных и профилях пациентов: AUC 0.615 ± 0.039 (CHB-MIT на TUSZ) и 0.762 ± 0.175 (TUSZ на CHB-MIT). Дополнительная пост-обработка улучшила эти результаты до 0.913 ± 0.064 и 0.867 ± 0.058 для внутридатасетного анализа и до 0.619 ± 0.036 и 0.768 ± 0.172 для кросс-датасетного. #### Значимость Модель PySeizure может быть применена в разнообразных клинических условиях, что позволяет улучшить диагностические процессы. Она обеспечивает высокую точность и гибкость, не зависит от конкретного датасета и может быть интегрирована с клиническими системами для повышения эффективности. Мы также открыли исходный код, что позволяет другим исследователям проводить эксперименты и расширять функциональность. #### Выводы Результаты показывают, что PySeizure является выгодной альтернативой традиционным методам обна

Abstract

Reliable seizure detection is critical for diagnosing and managing epilepsy, yet clinical workflows remain dependent on time-consuming manual EEG interpretation. While machine learning has shown promise, existing approaches often rely on dataset-specific optimisations, limiting their real-world applicability and reproducibility. Here, we introduce an innovative, open-source machine-learning framework that enables robust and generalisable seizure detection across varied clinical datasets. We evaluate our approach on two publicly available EEG datasets that differ in patient populations and electrode configurations. To enhance robustness, the framework incorporates an automated pre-processing pipeline to standardise data and a majority voting mechanism, in which multiple models independently assess each second of EEG before reaching a final decision. We train, tune, and evaluate models within each dataset, assessing their cross-dataset transferability. Our models achieve high within-dataset performance (AUC 0.904+/-0.059 for CHB-MIT and 0.864+/-0.060 for TUSZ) and demonstrate strong generalisation across datasets despite differences in EEG setups and populations (AUC 0.615+/-0.039 for models trained on CHB-MIT and tested on TUSZ and 0.762+/-0.175 in the reverse case) without any post-processing. Furthermore, a mild post-processing improved the within-dataset results to 0.913+/-0.064 and 0.867+/-0.058 and cross-dataset results to 0.619+/-0.036 and 0.768+/-0.172. These results underscore the potential of, and essential considerations for, deploying our framework in diverse clinical settings. By making our methodology fully reproducible, we provide a foundation for advancing clinically viable, dataset-agnostic seizure detection systems. This approach has the potential for widespread adoption, complementing rather than replacing expert interpretation, and accelerating clinical integration.

Ссылки и действия

Связанные статьи

Adaptive Segmentation of EEG for Machine Learning Applications

## Контекст Электроэнцефалограмма (EEG) представляет собой непрерывные значения, отражающие электрическую активность моз...

2025-08-29