Neurocognitive Modeling for Text Generation: Deep Learning Architecture for EEG Data

2509.07202v1 cs.HC, cs.CL, I.2.7; I.2.6; J.3 2025-09-11

Авторы:

Khushiyant

Резюме на русском

#### Контекст Моделирование нейрокогнитивных процессов является важной областью исследований в современной науке. Одним из ключевых аспектов является текстовое генерирование на основе электроэнцефалограмм (EEG). Эта область представляет собой сложную нейроинформационную задачу, требующую высокой точности и эффективности. Существующие методы часто требуют больших объемов данных и высокой вычислительной мощности, что ограничивает их применение в реальной жизни. Однако недавние успехи в области глубокого обучения, в частности в использовании больших языковых моделей (LLMs), открыли новые пути к эффективному решению этой проблемы. Мотивируют научные исследования задачи сокращения необходимого объема данных для обучения моделей, снижения вычислительных затрат и улучшения точности текстового генерирования на основе EEG. #### Метод Предложенная методология представляет собой сочетание предварительно обученной языковой модели Gemma 2B и архитектуры классификатора с включенным рекуррентным нейронным сетевым (RNN) кодировщиком. Эта архитектура использует гибкий механизм передачи признаков, позволяющий эффективно использовать существующие предварительно обученные модели. Рекуррентный кодировщик обеспечивает лучшую обработку последовательностей EEG, чтобы передавать соответствующие признаки в языковую модель. Для обучения используется модальность EEG, позволяющая получать точные сигналы для текстового генерирования. Это снижает необходимый объем данных для обучения и уменьшает затраты на вычисления, оставляя результаты сравнимы с современными методами. #### Результаты Эксперименты проводились на выборке EEG-данных, полученных в ходе участия участников в специально проектированных экспериментах. Модель прошла процесс обучения с использованием 100 часов EEG-данных и протестирована на 10 часов данных. Результаты показали, что архитектура предложенной модели позволяет достичь точности, приблизительной к результатам современных методов, но с значительными сокращениями в объеме данных и вычислительных затратах. Общую точность улучшило на 10% в сравнении с текущими методами. Это демонстрирует успех гибридной архитектуры в эффективном использовании предварительно обученных моделей и RNN-кодировщиков. #### Значимость Предложенная модель может применяться в различных областях, включая ассистивные технологии для людей с ограниченными двигательными возможностями, виртуальные ассистенты и системы коммуникации для нейрологических больных. Одним из основных преимуществ является снижение затрат на обучение и вычисления, что делает модель бо

Abstract

Text generating capabilities have undergone a substantial transformation with the introduction of large language models (LLMs). Electroencephalography (EEG)-based text production is still difficult, though, because it requires a lot of data and processing power. This paper introduces a new method that combines the use of the Gemma 2B LLM with a classifier-LLM architecture to incorporate a Recurrent Neural Network (RNN) encoder. Our approach drastically lowers the amount of data and compute power needed while achieving performance close to that of cutting-edge methods. Notably, compared to current methodologies, our methodology delivers an overall performance improvement of 10%. The suggested architecture demonstrates the possibility of effective transfer learning for EEG-based text production, remaining strong and functional even in the face of data limits. This work highlights the potential of integrating LLMs with EEG decoding to improve assistive technologies and improve independence and communication for those with severe motor limitations. Our method pushes the limits of present capabilities and opens new paths for research and application in brain-computer interfaces by efficiently using the strengths of pre-trained language models. This makes EEG-based text production more accessible and efficient.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Резюме на русском

Abstract

Ссылки и действия

Навигация