Wearable Music2Emotion : Assessing Emotions Induced by AI-Generated Music through Portable EEG-fNIRS Fusion

2508.04723v1 cs.SD, cs.AI, eess.AS 2025-08-09

Авторы:

Sha Zhao, Song Yi, Yangxuan Zhou, Jiadong Pan, Jiquan Wang, Jie Xia, Shijian Li, Shurong Dong, Gang Pan

Резюме на русском

## КОНТЕКСТ И ПРОБЛЕМАТИКА Изучение эмоций и их связи с музыкой представляет собой важный аспект в области affective computing и нейротехнологий. Музыка известна как мощный стимул для индукции эмоций, и её применение в комбинации с техниками Brain-computer Interface (BCI) открывает новые возможности для оценки и регуляции эмоционального состояния. Однако существующие исследования сталкиваются с тремя ключевыми проблемами. Во-первых, **ограничения в выборе стимулов**: традиционные музыкальные корпусы ограничены по размеру из-за проблем с авторскими правами и высокими затратами на кураторство. Это приводит к субъективности выбора музыки, основанной на грубой корреляции между эмоциями и музыкальными характеристиками, которая не учитывает индивидуальные эмоциональные профили. Во-вторых, **ограниченность модальности данных**: многие исследования основываются на унимодальных данных, таких как электроэнцефалография (EEG), что ограничивает понимание эмоциональных процессов, так как игнорируются дополнительные данные из других модальностей, таких как функциональная оптическая томография (fNIRS). В-третьих, **ограниченность портативности**: традиционные системы, такие как штатные гелевые EEG-капы с большим числом каналов, тяжелые и неудобные для повседневного использования, что создает значительные препятствия для реального применения. Для решения этих проблем, исследование предлагает MEEtBrain – инновационный портативный мультимодальный фреймворк, который комбинирует музыку, сгенерированную с помощью искусственного интеллекта (AI), с одновременной записью EEG и fNIRS с помощью лёгкого беспроводного головного устройства, оснащенного сухой электродой. ## ПРЕДЛОЖЕННЫЙ МЕТОД MEEtBrain представляет собой комплексное решение для анализа эмоций (валентность/возбудимость) с помощью мультимодальных нейрофизиологических сигналов. Основными компонентами фреймворка являются: 1. **AI-генерированные музыкальные стимулы**: Искусственный интеллект генерирует музыку в реальном времени, обеспеченную разнообразием и устраняющую субъективность выбора стимулов. 2. **Портативное устройство**: Головное устройство в виде лёгкого беспроводного бандана, оснащенного сухой электродой, позволяет одновременно записывать EEG и fNIRS. Это обеспечивает высокую портативность и комфорт для пользователя. 3. **Мультимодальный анализ**: Данные EEG и fNIRS синхронизированы, что позволяет получать более глубокие и точные инсайты в эмоциональные реакции на музыку. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для проверки эффективности фреймворка было проведено исследование с 20 участниками, в ходе которого была собрана 14-часовая база данных. Участники слушали музыку, сгенерированную AI, при этом регистрировались их эмоциональные реакции через EEG и fNIRS. Результаты показали, что AI-генерированная музыка эффективно индуцирует целевые эмоции (валентность/возбудимость). В настоящее время исследование продолжается, и база данных расширена до 44 участников. Данные будут доступны в открытом доступе для дальнейшего исследования и применения. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ MEEtBrain имеет широкое применение в областях психотерапии, управления стрессом, и взаимодействия человека с искусственным интеллектом. Портативность и мультимодальность делают его применимым в реальных условиях, в том числе в домашних условиях и вне клинических помещений. Открытый доступ к данным позволяет разработчикам и исследователям продолжать работу над улучшением алгоритмов и приложений. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ MEEtBrain успешно решает проблемы субъективности выбора музыки, ограниченности модальности данных и непортативности существующих систем. Будущие исследования могут фокусироваться на улучшении точности анализа эмоций, расширении базы данных и интеграции дополнительных модальностей, таких как движения и голосовые сигналы. Такой подход может привести к созданию более эффективных систем для мониторинга и регуляции эмоционального состояния в реальном времени.

Abstract

Emotions critically influence mental health, driving interest in music-based affective computing via neurophysiological signals with Brain-computer Interface techniques. While prior studies leverage music's accessibility for emotion induction, three key limitations persist: \textbf{(1) Stimulus Constraints}: Music stimuli are confined to small corpora due to copyright and curation costs, with selection biases from heuristic emotion-music mappings that ignore individual affective profiles. \textbf{(2) Modality Specificity}: Overreliance on unimodal neural data (e.g., EEG) ignores complementary insights from cross-modal signal fusion.\textbf{ (3) Portability Limitation}: Cumbersome setups (e.g., 64+ channel gel-based EEG caps) hinder real-world applicability due to procedural complexity and portability barriers. To address these limitations, we propose MEEtBrain, a portable and multimodal framework for emotion analysis (valence/arousal), integrating AI-generated music stimuli with synchronized EEG-fNIRS acquisition via a wireless headband. By MEEtBrain, the music stimuli can be automatically generated by AI on a large scale, eliminating subjective selection biases while ensuring music diversity. We use our developed portable device that is designed in a lightweight headband-style and uses dry electrodes, to simultaneously collect EEG and fNIRS recordings. A 14-hour dataset from 20 participants was collected in the first recruitment to validate the framework's efficacy, with AI-generated music eliciting target emotions (valence/arousal). We are actively expanding our multimodal dataset (44 participants in the latest dataset) and make it publicly available to promote further research and practical applications. \textbf{The dataset is available at https://zju-bmi-lab.github.io/ZBra.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Wearable Music2Emotion : Assessing Emotions Induced by AI-Generated Music through Portable EEG-fNIRS Fusion

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

RRPO: Robust Reward Policy Optimization for LLM-based Emotional TTS

Multi-Loss Learning for Speech Emotion Recognition with Energy-Adaptive Mixup an...

Multidimensional Music Aesthetic Evaluation via Semantically Consistent C-Mixup ...

Aligning Generative Music AI with Human Preferences: Methods and Challenges

Real-Time Speech Enhancement via a Hybrid ViT: A Dual-Input Acoustic-Image Featu...

Навигация