CompLex: Music Theory Lexicon Constructed by Autonomous Agents for Automatic Music Generation
2508.19603v1
cs.SD, cs.AI
2025-08-29
Авторы:
Zhejing Hu, Yan Liu, Gong Chen, Bruce X. B. Yu
Резюме на русском
## Контекст
Музыкальное поколение с использованием искусственного интеллекта (ИИ) становится все более популярным в области творческих технологий, но столкнется с рядом проблем. Одним из ограничений является недостаточное количество музыкальных данных, что снижает качество и точность генерируемых музыкальных произведений. Также существует трудность в интеграции знаний о музыкальной теории в генерирующие модели ИИ, чтобы улучшить их навыки в алгоритмической композиции и стилевом переходе. Эта проблема становится актуальной в связи с ростом спроса на музыкальные решения в различных отраслях, таких как развлекательные и технологические сферы.
## Метод
Модель CompLex предлагает новый подход к автоматической конструкции лексикона музыкальной теории. Она использует небольшой набор ключевых слов и шаблонов предложений для создания 37 432 элементов лексикона. Для повышения точности используется многоагентная архитектура, которая автоматически обнаруживает и исправляет ошибки в генерируемых элементах. Эта архитектура основывается на коллаборативной модели многоагентного решения задач, используя техники машинного обучения и естественного языка для обеспечения высокого качества и точности лексикона.
## Результаты
Проведены эксперименты с CompLex на трех современных моделях генерирования музыки, включая аудио- и символическое представление музыки. Модель CompLex показала значительные улучшения в параметрах, таких как комплексность, точность, непересеченность и выполнимость. Эти результаты были подтверждены экспертным оценкой, которая подтвердила его качество и его полезность для повышения качества музыкальных произведений в различных сценариях генерирования.
## Значимость
Модель CompLex может быть применена в различных областях, включая разработку музыкальных алгоритмов, автоматическое подбор звуков, стилевой переход и творческие задачи. Она предлагает преимущества в скорости и эффективности в сравнении с традиционными методами, а также расширяет возможности для творческого поиска. Будущие исследования будут сфокусированы на повышении качества генерируемого музыкального контента, а также на расширении функциональных возможностей CompLex.
## Выводы
Модель CompLex представляет собой значительное предложение в области генерируемой музыки. Она демонстрирует высокую эффективность в создании лексикона и его использовании в различных моделях генерирования музыки. Дальнейшие исследования будут направлены на усовершенствование модели и расширение ее возможностей, чтобы полностью использовать ее потенциал в разли
Abstract
Generative artificial intelligence in music has made significant strides, yet
it still falls short of the substantial achievements seen in natural language
processing, primarily due to the limited availability of music data.
Knowledge-informed approaches have been shown to enhance the performance of
music generation models, even when only a few pieces of musical knowledge are
integrated. This paper seeks to leverage comprehensive music theory in
AI-driven music generation tasks, such as algorithmic composition and style
transfer, which traditionally require significant manual effort with existing
techniques. We introduce a novel automatic music lexicon construction model
that generates a lexicon, named CompLex, comprising 37,432 items derived from
just 9 manually input category keywords and 5 sentence prompt templates. A new
multi-agent algorithm is proposed to automatically detect and mitigate
hallucinations. CompLex demonstrates impressive performance improvements across
three state-of-the-art text-to-music generation models, encompassing both
symbolic and audio-based methods. Furthermore, we evaluate CompLex in terms of
completeness, accuracy, non-redundancy, and executability, confirming that it
possesses the key characteristics of an effective lexicon.
Ссылки и действия
Дополнительные ресурсы: