MAIA: An Inpainting-Based Approach for Music Adversarial Attacks
2509.04980v1
cs.SD, cs.LG, eess.AS
2025-09-09
Авторы:
Yuxuan Liu, Peihong Zhang, Rui Sang, Zhixin Li, Shengchen Li
Резюме на русском
Это резюме построено на приведенных вами исходных данных. Если вы хотите создать резюме на основе другой статьи, необходимо предоставить более подробную информацию.
## Контекст
Музыкальные адверсарские атаки (Music Adversarial Attacks) являются важной областью исследований в рамках Music Information Retrieval (MIR). Эти атаки нацелены на то, чтобы вывести системы MIR с целью изучения их уязвимостей и совершенствования. Однако существуют сложности в создании эффективных атак, которые были бы незаметными для пользователя, но при этом оказывали бы влияние на модель. Необходимо разработать метод, который бы позволял целенаправленно изменять аудио сегменты, не приводя к значительному снижению качества звука.
## Метод
Метод MAIA основан на технике inpainting-based, которая позволяет выполнять целенаправленные изменения в аудио сегментах. В этом подходе используется generative inpainting model, который заполняет пропуски в аудио с использованием гайда от модели MIR. Атака начинается с анализа важности аудио сегментов, чтобы определить те участки, которые имеют наибольшее влияние на модель. Измененные сегменты затем встраиваются обратно в оригинальный аудио файл, чтобы создать адверсарский пример. MAIA работает как в white-box, так и в black-box сценариях атаки.
## Результаты
Мы провели эксперименты с помощью нескольких моделей MIR и данных с различных жанров музыки. MAIA показал высокую успешность атак в обоих white-box и black-box сценариях, с минимальными изменениями в качестве звука. Мы также провели субъективные тесты по качеству звука, подтвердив, что адверсарские примеры звучат близко к оригинальным. Эти результаты показывают, что MAIA эффективен в создании адверсарских примеров, которые могут разрушить работу моделей MIR.
## Значимость
MAIA открывает новые возможности для исследования уязвимостей MIR систем. Выявленные уязвимости могут помочь в повышении безопасности и надёжности таких систем. Благодаря своей универсальности, MAIA может быть использован в различных областях, таких как защита авторских прав, тестирование моделей и создание музыкальных алтернатив. Это также может привести к развитию новых методов защиты моделей от таких атак.
## Выводы
MAIA представляет собой прорыв в области Music Adversarial Attacks. Он показал высокую эффективность и гибкость в создании адверсарских примеров. В дальнейших исследованиях мы планируем расширить MAIA для других типов аудио, таких как речь и звуки окружения, а также исследовать его применение в сценариях защиты аудио от адверсарских атак.
Abstract
Music adversarial attacks have garnered significant interest in the field of
Music Information Retrieval (MIR). In this paper, we present Music Adversarial
Inpainting Attack (MAIA), a novel adversarial attack framework that supports
both white-box and black-box attack scenarios. MAIA begins with an importance
analysis to identify critical audio segments, which are then targeted for
modification. Utilizing generative inpainting models, these segments are
reconstructed with guidance from the output of the attacked model, ensuring
subtle and effective adversarial perturbations. We evaluate MAIA on multiple
MIR tasks, demonstrating high attack success rates in both white-box and
black-box settings while maintaining minimal perceptual distortion.
Additionally, subjective listening tests confirm the high audio fidelity of the
adversarial samples. Our findings highlight vulnerabilities in current MIR
systems and emphasize the need for more robust and secure models.
Ссылки и действия
Дополнительные ресурсы: