MAIA: An Inpainting-Based Approach for Music Adversarial Attacks

2509.04980v1 cs.SD, cs.LG, eess.AS 2025-09-09

Авторы:

Yuxuan Liu, Peihong Zhang, Rui Sang, Zhixin Li, Shengchen Li

Резюме на русском

Это резюме построено на приведенных вами исходных данных. Если вы хотите создать резюме на основе другой статьи, необходимо предоставить более подробную информацию. ## Контекст Музыкальные адверсарские атаки (Music Adversarial Attacks) являются важной областью исследований в рамках Music Information Retrieval (MIR). Эти атаки нацелены на то, чтобы вывести системы MIR с целью изучения их уязвимостей и совершенствования. Однако существуют сложности в создании эффективных атак, которые были бы незаметными для пользователя, но при этом оказывали бы влияние на модель. Необходимо разработать метод, который бы позволял целенаправленно изменять аудио сегменты, не приводя к значительному снижению качества звука. ## Метод Метод MAIA основан на технике inpainting-based, которая позволяет выполнять целенаправленные изменения в аудио сегментах. В этом подходе используется generative inpainting model, который заполняет пропуски в аудио с использованием гайда от модели MIR. Атака начинается с анализа важности аудио сегментов, чтобы определить те участки, которые имеют наибольшее влияние на модель. Измененные сегменты затем встраиваются обратно в оригинальный аудио файл, чтобы создать адверсарский пример. MAIA работает как в white-box, так и в black-box сценариях атаки. ## Результаты Мы провели эксперименты с помощью нескольких моделей MIR и данных с различных жанров музыки. MAIA показал высокую успешность атак в обоих white-box и black-box сценариях, с минимальными изменениями в качестве звука. Мы также провели субъективные тесты по качеству звука, подтвердив, что адверсарские примеры звучат близко к оригинальным. Эти результаты показывают, что MAIA эффективен в создании адверсарских примеров, которые могут разрушить работу моделей MIR. ## Значимость MAIA открывает новые возможности для исследования уязвимостей MIR систем. Выявленные уязвимости могут помочь в повышении безопасности и надёжности таких систем. Благодаря своей универсальности, MAIA может быть использован в различных областях, таких как защита авторских прав, тестирование моделей и создание музыкальных алтернатив. Это также может привести к развитию новых методов защиты моделей от таких атак. ## Выводы MAIA представляет собой прорыв в области Music Adversarial Attacks. Он показал высокую эффективность и гибкость в создании адверсарских примеров. В дальнейших исследованиях мы планируем расширить MAIA для других типов аудио, таких как речь и звуки окружения, а также исследовать его применение в сценариях защиты аудио от адверсарских атак.

Abstract

Music adversarial attacks have garnered significant interest in the field of Music Information Retrieval (MIR). In this paper, we present Music Adversarial Inpainting Attack (MAIA), a novel adversarial attack framework that supports both white-box and black-box attack scenarios. MAIA begins with an importance analysis to identify critical audio segments, which are then targeted for modification. Utilizing generative inpainting models, these segments are reconstructed with guidance from the output of the attacked model, ensuring subtle and effective adversarial perturbations. We evaluate MAIA on multiple MIR tasks, demonstrating high attack success rates in both white-box and black-box settings while maintaining minimal perceptual distortion. Additionally, subjective listening tests confirm the high audio fidelity of the adversarial samples. Our findings highlight vulnerabilities in current MIR systems and emphasize the need for more robust and secure models.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

MAIA: An Inpainting-Based Approach for Music Adversarial Attacks

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Fine-tuning Pre-trained Audio Models for COVID-19 Detection: A Technical Report

Transformer Redesign for Late Fusion of Audio-Text Features on Ultra-Low-Power E...

ProGress: Structured Music Generation via Graph Diffusion and Hierarchical Music...

BACHI: Boundary-Aware Symbolic Chord Recognition Through Masked Iterative Decodi...

Transcribing Rhythmic Patterns of the Guitar Track in Polyphonic Music

Навигация