Bridging the Gap: A Framework for Real-World Video Deepfake Detection via Social Network Compression Emulation

2508.08765v1 cs.CV, cs.AI 2025-08-14
Авторы:

Andrea Montibeller, Dasara Shullani, Daniele Baracchi, Alessandro Piva, Giulia Boato

Резюме на русском

## Контекст В последние годы рост применения глубокого обучения привел к появлению новых форм синтезированного видео, таких как глубокие подделки (deepfakes). Эти технологии находят применение в различных сферах, от развлечений до мошенничества. Особенно актуальной стала проблема глубоких подделок на социальных сетях, где пользователи подвергаются угрозе дезинформации и мошенничества. Существующие методы обнаружения глубоких подделок часто разрабатываются и тестируются в управляемых условиях, но не могут надёжно работать в реальных условиях, где видео подвергаются агрессивной сжатию и преобразованиям. Это сделано для экономии ресурсов и повышения скорости раздачи контента. Мы предлагаем первый подход, который эмулирует социальные сети, используя компрессию и перераспределение параметров, полученных из небольшого набора видео, чтобы создать локальный эмулятор для видео-соцсетей. ## Метод Мы предлагаем фреймворк, который эмулирует процессы компрессии видео на социальных платформах, основываясь на маленьких наборах видео, загруженных на данные платформы. Для этого мы используем алгоритм, оценивающий параметры компрессии и размещения из загруженных данных. Эти параметры используются для создания локального эмулятора, который может воспроизвести специфические артефакты, внедренные в видео, после сжатия и перераспределения. Это достигается без необходимости применения API социальных сетей, что делает наше решение эффективным и практичным. ## Результаты Мы проводили эксперименты с видео, загруженными на FaceForensics++, которые после этого были распространены через социальные сети. Наши эмуляционные данные были сравнены с реальными данными, и мы установили, что они имеют похожие характеристики и артефакты. Мы также сравнили работу различных сетей глубокого обучения, которые были тренированы на этих эмулированных данных и реальных данных. Результаты показали, что детекторы, обученные на наших эмулированных данных, смогли достичь почти той же точности, что и детекторы, обученные на реальных данных. Это подтверждает эффективность нашего подхода. ## Значимость Наш фреймворк может иметь большое значение в области обнаружения глубоких подделок, так как он предлагает решение для ситуации, когда существующие методы работают ненадежно на сжатых видео, которые распространяются через социальные сети. Это позволяет увеличить эффективность и надежность детекторов глубоких подделок, сделав их более пригодными для использования в реальных условиях. Мы также открываем путь для дальнейших исследований в области эмуляции социальных сетей для

Abstract

The growing presence of AI-generated videos on social networks poses new challenges for deepfake detection, as detectors trained under controlled conditions often fail to generalize to real-world scenarios. A key factor behind this gap is the aggressive, proprietary compression applied by platforms like YouTube and Facebook, which launder low-level forensic cues. However, replicating these transformations at scale is difficult due to API limitations and data-sharing constraints. For these reasons, we propose a first framework that emulates the video sharing pipelines of social networks by estimating compression and resizing parameters from a small set of uploaded videos. These parameters enable a local emulator capable of reproducing platform-specific artifacts on large datasets without direct API access. Experiments on FaceForensics++ videos shared via social networks demonstrate that our emulated data closely matches the degradation patterns of real uploads. Furthermore, detectors fine-tuned on emulated videos achieve comparable performance to those trained on actual shared media. Our approach offers a scalable and practical solution for bridging the gap between lab-based training and real-world deployment of deepfake detectors, particularly in the underexplored domain of compressed video content.

Ссылки и действия