Foundation Models for Cross-Domain EEG Analysis Application: A Survey
2508.15716v1
cs.HC, cs.AI
2025-08-23
Авторы:
Hongqi Li, Yitong Chen, Yujuan Wang, Weihang Ni, Haodong Zhang
Резюме на русском
## Контекст
Электроэнцефалография (EEG) — это важный инструмент в нейронауках и искусственном интеллекте, используемый для изучения работы мозга. С появлением фундаментальных моделей (foundation models) в AI, эти модели начали выступать в роли нового подхода к анализу EEG. Они обладают высокой степенью общеупотребительности и могут обрабатывать разные задачи анализа. Однако существует проблема: развитие этих моделей происходит несистематично, архитектуры разные, и нет полного понимания их модификаций. Этот факт ограничивает возможности применения этих моделей в реальных ситуациях. Целью данного исследования является создание систематической категоризации фундаментальных моделей EEG и подробное изучение их мотиваций, архитектур и возможностей.
## Метод
Для исследования мы предлагаем модально-ориентированную систему классификации фундаментальных моделей EEG, основанную на их выходных модах. Эти модали делятся на группы: EEG-to-text, EEG-to-vision, EEG-to-audio и полномасштабные модели, обрабатывающие несколько типов данных. Нам удалось собрать и анализировать более 30 работ, описывающих различные модели. Таким образом, мы можем структурировать полученные данные и выявить общие модели, архитектуры и проблемы. Основной метод — структурированный анализ статей и их описание в рамках предложенной системы классификации.
## Результаты
Мы проанализировали более 30 работ, описывающих различные модели анализа EEG. Эти модели разделены на 4 основных типа: EEG-to-text, EEG-to-vision, EEG-to-audio и более сложные модели для нескольких типов данных. Мы определили, что каждая модель имеет уникальные характеристики, архитектуры и применения. Например, EEG-to-text модели специализируются на переводе сигналов EEG в текст, EEG-to-vision — на интерпретацию сигналов в визуальные сцены. Мы также выявили типичные проблемы, такие как недостаточная точность и сложность моделей.
## Значимость
Предложенная систематизация может привести к существенным преимуществам в различных областях. Во-первых, она позволяет лучше понять суть работы каждой модели и их модификаций. Во-вторых, она облегчает разработку новых моделей, так как предоставляет структуру для их развития. В-третьих, она может помочь в развитии решений для реальных задач, таких как диагностика заболеваний мозга, оценка эмоций и интерактивные системы для нейрореабилитации. Этот подход может ускорить процесс перехода от теоретических моделей к их реализации в реальной жизни.
## Выводы
Мы представили первую системутизированную категоризацию фундаментальных моделей EEG, которая охватывает различные модали и типы задач анализа. Наши исследовани
Abstract
Electroencephalography (EEG) analysis stands at the forefront of neuroscience
and artificial intelligence research, where foundation models are reshaping the
traditional EEG analysis paradigm by leveraging their powerful representational
capacity and cross-modal generalization. However, the rapid proliferation of
these techniques has led to a fragmented research landscape, characterized by
diverse model roles, inconsistent architectures, and a lack of systematic
categorization. To bridge this gap, this study presents the first comprehensive
modality-oriented taxonomy for foundation models in EEG analysis,
systematically organizing research advances based on output modalities of the
native EEG decoding, EEG-text, EEG-vision, EEG-audio, and broader multimodal
frameworks. We rigorously analyze each category's research ideas, theoretical
foundations, and architectural innovations, while highlighting open challenges
such as model interpretability, cross-domain generalization, and real-world
applicability in EEG-based systems. By unifying this dispersed field, our work
not only provides a reference framework for future methodology development but
accelerates the translation of EEG foundation models into scalable,
interpretable, and online actionable solutions.
Ссылки и действия
Дополнительные ресурсы: