Data-Driven Analysis of Text-Conditioned AI-Generated Music: A Case Study with Suno and Udio
2509.11824v1
cs.IR, cs.AI, cs.LG, cs.SD
2025-09-17
Авторы:
Luca Casini, Laura Cros Vila, David Dalmazzo, Anna-Kaisa Kaila, Bob L. T. Sturm
Резюме на русском
## Контекст
Онлайн-платформы для создания музыки с использованием текстовых подсказок (AI music), такие как Suno и Udio, привлекли сотни тысяч пользователей. Эти платформы находят применение в рекламе и даже в чартах музыкальных хитов в нескольких странах. Насколько эффективно и широко используются эти сервисы? Какие темы вдохновляют их пользователей? Целью данного исследования является осуществить подробный анализ этих вопросов, основываясь на большой коллекции музыки, сгенерированной пользователями Suno и Udio с мая по октябрь 2024 года. Результаты этого анализа должны пролить свет на поведение пользователей, их интересы и стратегии взаимодействия с AI-системами.
## Метод
Для получения данных были использованы музыкальные композиции, созданные пользователями Suno и Udio в указанный период. Методология исследования включала сочетание нескольких стандартных методов, включая текстовые модели для эмбеддингов, методы снижения размерности и кластеризацию. Эти техники были применены для анализа текстовых подсказок, тегов и текстов песен. Далее, полученные результаты были автоматически обработаны и представлены в виде интерактивных визуализаций, позволяющих проанализировать и анализировать данные с разных углов.
## Результаты
На основе исследования были выявлены основные темы в текстах песен, такие как любовь, жизнь и персональные опыты. Также были выявлены различные стратегии взаимодействия с AI-системами, включая использование мета-тегов для направления вывода моделей. Было выявлено, что пользователи предпочитают определенные языки для создания текстов, что влияет на конечный результат. Еще одним значимым результатом было выявление аномалий в поведении пользователей, в том числе попыток "стейкинга" АИ, чтобы повлиять на результат.
## Значимость
Результаты этого исследования имеют значительное значение для музыкальных исследований, особенно в контексте развития AI-технологий в музыкальном производстве. Они позволяют понять, как пользователи взаимодействуют с AI-системами, как они используют текстовые подсказки, а также как эти системы могут быть обмануты. Эти полученные результаты могут быть применены в музыкальной промышленности для улучшения систем AI, для развития новых музыкальных жанров и для изучения культурных явлений, связанных с AI-музыкой.
## Выводы
Основные достижения этой работы заключаются в получении подробного анализа текстов и стратегий взаимодействия с AI-системами, создающими музыку. Были выявлены значимые темы и языковые предпочтения, а также выявлены
Abstract
Online AI platforms for creating music from text prompts (AI music), such as
Suno and Udio, are now being used by hundreds of thousands of users. Some AI
music is appearing in advertising, and even charting, in multiple countries.
How are these platforms being used? What subjects are inspiring their users?
This article answers these questions for Suno and Udio using a large collection
of songs generated by users of these platforms from May to October 2024. Using
a combination of state-of-the-art text embedding models, dimensionality
reduction and clustering methods, we analyze the prompts, tags and lyrics, and
automatically annotate and display the processed data in interactive plots. Our
results reveal prominent themes in lyrics, language preference, prompting
strategies, as well as peculiar attempts at steering models through the use of
metatags. To promote the musicological study of the developing cultural
practice of AI-generated music we share our code and resources.