Balancing Privacy and Efficiency: Music Information Retrieval via Additive Homomorphic Encryption
2508.07044v1
cs.DB, cs.AI, cs.CR
2025-08-13
Авторы:
William Zerong Wang, Dongfang Zhao
Резюме на русском
#### Контекст
В эпоху развития умственных технологий, таких как генерирующая AI, возникают уникальные проблемы с защитой конфиденциальности музыкальных данных. Музыка, в отличие от статичных искусств, таких как изображения, является временной и мультимодальной сущностью. Она изменяется, цифровой воспроизведением и перемешиванием на масштабе, без прецедента. Такие характеристики делают векторные представления музыкальных файлов (embeddings) особенно уязвимыми для несанкционированного изучения, неправомерного использования или кражи без непосредственного доступа к оригинальным аудиофайлам. Традиционные методы, такие как авторское право или цифровые водяные засечки, обеспечивают только ограниченную защиту этих абстрактных математических представлений. Необходима защита на более высоком уровне, например, криптографической. Однако шифрование, например AES, творит данные нечитаемыми для вычислений, что ставит под угрозу практическую возможность поиска и анализа. Хотя Fully Homomorphic Encryption (FHE) обеспечивает вычисления над зашифрованными данными, его высокая стоимость вычислительных ресурсов сделала его неприменимым для больших масштабных поисков векторных сходств.
#### Метод
Чтобы решить эти проблемы, мы предлагаем использовать Additive Homomorphic Encryption (AHE) для поиска векторных сходств в системах информационного восприятия музыки. AHE позволяет выполнять операции сложения над зашифрованными данными без расшифровки. Мы анализировали угрозы, специфичные для систем информационного восприятия музыки, и предложили эффективную стратегию для решения проблемы внутренних произведений музыкальных векторов, позволяющую выполнять правильные поисковые запросы на сходство, сохраняя при этом конфиденциальность данных. Разработанная архитектура включает оптимизированные методы для оценки внутренних произведений на зашифрованных данных, используя AHE. Эта стратегия обеспечивает баланс между защитой конфиденциальности и вычислительной эффективностью.
#### Результаты
Мы проводили эксперименты с реальными данными в формате MP3, сравнивая нашу реализацию AHE с существующими FHE-решениями. Результаты показали, что наш подход обеспечивает более высокую производительность в поиске векторных сходств, сохраняя при этом конфиденциальность данных. Особенно выдающимися оказались результаты в сравнении с FHE-решениями, где AHE показала значительно низкий ввод и вывод времени, благодаря его более эффективной структуре вычислений. Эти результаты доказывают применимость AHE для решения задач информационного восприятия музыки, обеспечивая защиту конфид
Abstract
In the era of generative AI, ensuring the privacy of music data presents
unique challenges: unlike static artworks such as images, music data is
inherently temporal and multimodal, and it is sampled, transformed, and remixed
at an unprecedented scale. These characteristics make its core vector
embeddings, i.e, the numerical representations of the music, highly susceptible
to being learned, misused, or even stolen by models without accessing the
original audio files. Traditional methods like copyright licensing and digital
watermarking offer limited protection for these abstract mathematical
representations, thus necessitating a stronger, e.g., cryptographic, approach
to safeguarding the embeddings themselves. Standard encryption schemes, such as
AES, render data unintelligible for computation, making such searches
impossible. While Fully Homomorphic Encryption (FHE) provides a plausible
solution by allowing arbitrary computations on ciphertexts, its substantial
performance overhead remains impractical for large-scale vector similarity
searches. Given this trade-off, we propose a more practical approach using
Additive Homomorphic Encryption (AHE) for vector similarity search. The primary
contributions of this paper are threefold: we analyze threat models unique to
music information retrieval systems; we provide a theoretical analysis and
propose an efficient AHE-based solution through inner products of music
embeddings to deliver privacy-preserving similarity search; and finally, we
demonstrate the efficiency and practicality of the proposed approach through
empirical evaluation and comparison to FHE schemes on real-world MP3 files.
Ссылки и действия
Дополнительные ресурсы: