Towards Reliable Audio Deepfake Attribution and Model Recognition: A Multi-Level Autoencoder-Based Framework
2508.02521v2
cs.SD, cs.CV, eess.AS
2025-08-09
Авторы:
Andrea Di Pierno, Luca Guarnera, Dario Allegra, Sebastiano Battiato
Резюме на русском
Аудио deepfakes становятся все более распространенными, создавая значительные проблемы для доверия в цифровых коммуникациях. Несмотря на прогресс в области их обнаружения, подтверждение аудио deepfakes до уровня конкретной генерирующей модели остается недооцененной, но крайне важной задачей. В статье предлагается LAVA (Layered Architecture for Voice Attribution) — расширенная архитектура, основанная на автоэнкодере, для обнаружения deepfakes и их привязки к конкретным моделям. Архитектура включает две классификаторы: Audio Deepfake Attribution (ADA) для определения технологии генерации и Audio Deepfake Model Recognition (ADMR) для идентификации конкретной модели. Для повышения устойчивости к условиям open-set внедрен механизм ограничения доверия. Результаты экспериментов на ASVspoof2021, FakeOrReal и CodecFake показали высокую точность: F1-score ADA превышает 95%, а ADMR — 96.31%. Дополнительные испытания подтвердили высокую надежность LAVA. Фреймворк представляет собой новую линию развития аудио deepfake attribution с подтверждённой эффективностью на публичных бенчмарках.
Abstract
The proliferation of audio deepfakes poses a growing threat to trust in
digital communications. While detection methods have advanced, attributing
audio deepfakes to their source models remains an underexplored yet crucial
challenge. In this paper we introduce LAVA (Layered Architecture for Voice
Attribution), a hierarchical framework for audio deepfake detection and model
recognition that leverages attention-enhanced latent representations extracted
by a convolutional autoencoder trained solely on fake audio. Two specialized
classifiers operate on these features: Audio Deepfake Attribution (ADA), which
identifies the generation technology, and Audio Deepfake Model Recognition
(ADMR), which recognize the specific generative model instance. To improve
robustness under open-set conditions, we incorporate confidence-based rejection
thresholds. Experiments on ASVspoof2021, FakeOrReal, and CodecFake show strong
performance: the ADA classifier achieves F1-scores over 95% across all
datasets, and the ADMR module reaches 96.31% macro F1 across six classes.
Additional tests on unseen attacks from ASVpoof2019 LA and error propagation
analysis confirm LAVA's robustness and reliability. The framework advances the
field by introducing a supervised approach to deepfake attribution and model
recognition under open-set conditions, validated on public benchmarks and
accompanied by publicly released models and code. Models and code are available
at https://www.github.com/adipiz99/lava-framework.
Ссылки и действия
Дополнительные ресурсы: