AnalysisGNN: Unified Music Analysis with Graph Neural Networks
2509.06654v1
cs.SD, cs.AI
2025-09-10
Авторы:
Emmanouil Karystinaios, Johannes Hentschel, Markus Neuwirth, Gerhard Widmer
Резюме на русском
#### Контекст
В последние годы растет интерес к вычислительным методам в области музыкального анализа. Однако большинство существующих подходов ориентированы на конкретные аналитические задачи, что ограничивает их широкое применение в различных дисциплинах. Эта проблема связана с тем, что музыкальные аналитические данные часто имеют различные форматы и структуры, что затрудняет их объединение в единое решение. Было принято решение разработать универсальный подход, который может обрабатывать разнообразные музыкальные данные с различными типами аналитических задач.
#### Метод
Мы предлагаем **AnalysisGNN**, новую архитектуру на основе графовых нейронных сетей (GNN). Эта модель использует стратегию перемешивания данных и пользовательский весовой многозадачный функционал потерь, а также фуссирование логитов из задач-классификаторов, чтобы объединить несколько типов аналитических данных. Для улучшения точности детекции нетонных нот (некоторые ноты, не являющиеся частью аккордов), мы добавили модуль для предсказания нетонных нот. Это решение позволяет исключить "ложные сигналы" и улучшить консистентность меток. Мы также разработали адаптивную архитектуру, которая может обрабатывать разные типы музыкальных данных в одном фреймворке.
#### Результаты
Мы провести эксперименты на нескольких задачах, включая классификацию аккордов, нот, типов нот и нетонных нот. Для этих задач у нас были данные из различных источников с разными метками. Мы сравнили результаты AnalysisGNN с существующими моделями и продемонстрировали, что наш подход показывает конкурентную точность и высокую устойчивость к разным типам аналитических данных. Эти результаты подтверждают устойчивость модели к разным типам музыкальных данных и консистентности меток в различных контекстах.
#### Значимость
AnalysisGNN может быть применен в разных областях музыкального анализа, таких как классификация музыкальных аккордов, детекция типов нот и нетонных нот. Его преимущество в том, что он может обрабатывать разные типы данных в единой модели, что повышает его универсальность. Это может существенно упростить работу музыкальных аналитиков и облегчить их работу с многообразными данными. Также, AnalysisGNN показал более высокую устойчивость к различным состояниям тренировочных данных, что делает его более надежным для практического применения.
#### Выводы
Мы представили новую модель AnalysisGNN, которая может интегрировать разные типы музыкальных данных для широкого спектра аналитических задач. Наши результаты показали, что модель демонстрирует высокую точность и устойчивость к разным типам данных. В будущем мы п
Abstract
Recent years have seen a boom in computational approaches to music analysis,
yet each one is typically tailored to a specific analytical domain. In this
work, we introduce AnalysisGNN, a novel graph neural network framework that
leverages a data-shuffling strategy with a custom weighted multi-task loss and
logit fusion between task-specific classifiers to integrate heterogeneously
annotated symbolic datasets for comprehensive score analysis. We further
integrate a Non-Chord-Tone prediction module, which identifies and excludes
passing and non-functional notes from all tasks, thereby improving the
consistency of label signals. Experimental evaluations demonstrate that
AnalysisGNN achieves performance comparable to traditional static-dataset
approaches, while showing increased resilience to domain shifts and annotation
inconsistencies across multiple heterogeneous corpora.
Ссылки и действия
Дополнительные ресурсы: