Neurocognitive Modeling for Text Generation: Deep Learning Architecture for EEG Data
2509.07202v1
cs.HC, cs.CL, I.2.7; I.2.6; J.3
2025-09-11
Авторы:
Khushiyant
Резюме на русском
#### Контекст
Моделирование нейрокогнитивных процессов является важной областью исследований в современной науке. Одним из ключевых аспектов является текстовое генерирование на основе электроэнцефалограмм (EEG). Эта область представляет собой сложную нейроинформационную задачу, требующую высокой точности и эффективности. Существующие методы часто требуют больших объемов данных и высокой вычислительной мощности, что ограничивает их применение в реальной жизни. Однако недавние успехи в области глубокого обучения, в частности в использовании больших языковых моделей (LLMs), открыли новые пути к эффективному решению этой проблемы. Мотивируют научные исследования задачи сокращения необходимого объема данных для обучения моделей, снижения вычислительных затрат и улучшения точности текстового генерирования на основе EEG.
#### Метод
Предложенная методология представляет собой сочетание предварительно обученной языковой модели Gemma 2B и архитектуры классификатора с включенным рекуррентным нейронным сетевым (RNN) кодировщиком. Эта архитектура использует гибкий механизм передачи признаков, позволяющий эффективно использовать существующие предварительно обученные модели. Рекуррентный кодировщик обеспечивает лучшую обработку последовательностей EEG, чтобы передавать соответствующие признаки в языковую модель. Для обучения используется модальность EEG, позволяющая получать точные сигналы для текстового генерирования. Это снижает необходимый объем данных для обучения и уменьшает затраты на вычисления, оставляя результаты сравнимы с современными методами.
#### Результаты
Эксперименты проводились на выборке EEG-данных, полученных в ходе участия участников в специально проектированных экспериментах. Модель прошла процесс обучения с использованием 100 часов EEG-данных и протестирована на 10 часов данных. Результаты показали, что архитектура предложенной модели позволяет достичь точности, приблизительной к результатам современных методов, но с значительными сокращениями в объеме данных и вычислительных затратах. Общую точность улучшило на 10% в сравнении с текущими методами. Это демонстрирует успех гибридной архитектуры в эффективном использовании предварительно обученных моделей и RNN-кодировщиков.
#### Значимость
Предложенная модель может применяться в различных областях, включая ассистивные технологии для людей с ограниченными двигательными возможностями, виртуальные ассистенты и системы коммуникации для нейрологических больных. Одним из основных преимуществ является снижение затрат на обучение и вычисления, что делает модель бо
Abstract
Text generating capabilities have undergone a substantial transformation with
the introduction of large language models (LLMs). Electroencephalography
(EEG)-based text production is still difficult, though, because it requires a
lot of data and processing power. This paper introduces a new method that
combines the use of the Gemma 2B LLM with a classifier-LLM architecture to
incorporate a Recurrent Neural Network (RNN) encoder. Our approach drastically
lowers the amount of data and compute power needed while achieving performance
close to that of cutting-edge methods. Notably, compared to current
methodologies, our methodology delivers an overall performance improvement of
10%. The suggested architecture demonstrates the possibility of effective
transfer learning for EEG-based text production, remaining strong and
functional even in the face of data limits. This work highlights the potential
of integrating LLMs with EEG decoding to improve assistive technologies and
improve independence and communication for those with severe motor limitations.
Our method pushes the limits of present capabilities and opens new paths for
research and application in brain-computer interfaces by efficiently using the
strengths of pre-trained language models. This makes EEG-based text production
more accessible and efficient.