A Survey of Threats Against Voice Authentication and Anti-Spoofing Systems

2508.16843v2 cs.CR, cs.AI 2025-08-27
Авторы:

Kamel Kamel, Keshav Sood, Hridoy Sankar Dutta, Sunil Aryal

Резюме на русском

## Контекст В последние годы голосовое аутентификационное технологическое решение, основанное на подходах, основанных на ранее использовавшихся в акустических характеристиках, превратилось в модели с нейронными сетей, извлекающие сильно устойчивые особые возможности. Это развитие расширило сферу применения голосовой аутентификации в финансовые учреждения, умные устройства, полицию и другие области. Однако, вместе с ростом широкого применения, риски и угрозы становятся все более остры. Недостатки и уязвимости моделей могут привести к ошибкам в проверке личности или к несанкционированному доступу. Обзорный анализ, представленный в этой статье, охватывает современные угрозы к голосовой аутентификационной системе (VAS) и системам противодействия подделке (CMs). Он включает в себя такие угрозы, как угрозы данных, атаки с адверсариальными примерами, создание deepfake-звуков и атаки с подделкой голоса. Эта статья поможет сформировать понимание развития угроз и существующих систем противодействия, чтобы способствовать развитию более надёжных и защищённых голосовых аутентификационных систем. ## Метод Обзорные аналитические работы, основывающиеся на систематизации и анализе литературы, становятся всё более востребованы, так как помогают отслеживать развитие технологий и их эволюцию. Этот обзор рассматривает развитие технологий голосовой аутентификации в рамках критического анализа их уязвимостей и угроз. Метод включает предварительный анализ существующих работ, описывая методологии, этапы развития, а также использованные данные. Он также включает в себя сравнение результатов различных систем, использование различных методов тестирования и интерпретации результатов. Это позволяет выявлять новые угрозы, отслеживать прогресс и предложить рекомендации по улучшению в сфере голосовой аутентификации. ## Результаты В результате работы был проведен интенсивный обзор литературы, включающий сравнение различных технологий, используемых в голосовой аутентификации и противодействии подделке. Были исследованы многочисленные данные, полученные в различных экспериментах. Результатом является создание общей картины развития голосовой аутентификации и её уязвимостей, в том числе атак с использованием адверсариальных примеров, deepfake-технологий и подделки голоса. Были выявлены характеристики уязвимости моделей, используемых методы защиты, и отдельно рассмотрены новые угрозы. Эта систематизация позволила выделить различные подходы, их преимущества и ограничения, что даёт базу для д

Abstract

Voice authentication has undergone significant changes from traditional systems that relied on handcrafted acoustic features to deep learning models that can extract robust speaker embeddings. This advancement has expanded its applications across finance, smart devices, law enforcement, and beyond. However, as adoption has grown, so have the threats. This survey presents a comprehensive review of the modern threat landscape targeting Voice Authentication Systems (VAS) and Anti-Spoofing Countermeasures (CMs), including data poisoning, adversarial, deepfake, and adversarial spoofing attacks. We chronologically trace the development of voice authentication and examine how vulnerabilities have evolved in tandem with technological advancements. For each category of attack, we summarize methodologies, highlight commonly used datasets, compare performance and limitations, and organize existing literature using widely accepted taxonomies. By highlighting emerging risks and open challenges, this survey aims to support the development of more secure and resilient voice authentication systems.

Ссылки и действия