VideoGuard: Protecting Video Content from Unauthorized Editing
2508.03480v1
cs.CV, cs.AI
2025-08-06
Авторы:
Junjie Cao, Kaizhou Li, Xinchun Yu, Hongxiang Li, Xiaoping Zhang
Резюме на русском
В последнее время генеративные модели достигли высоких результатов в генерации и редактировании цифрового контента, но их злоупотребление может привести к распространению вводящей в заблуждение информации. Несмотря на существование методов защиты фотографических изображений от несанкционерного редактирования, видеоконтент остаётся менее защищённым. Для решения этой проблемы предлагается VideoGuard — метод защиты видеоконтента от неавторизованных редактирований. Защита основывается на введении малозаметных пертурбаций, которые нарушают работу генеративных моделей диффузии. Учитывая избыточность между кадрами и механизмы внимания межкадрового характера в моделях видеодиффузии, VideoGuard использует совместную оптимизацию кадров и интегрирует в них движенческую информацию. Это позволяет гарантировать, что модели будут генерировать неконсистентные или неправдоподобные результаты. Метод показал высокую эффективность по сравнению с существующими подходами, подтверждая свою преимущественную роль в защите видеоконтента.
Abstract
With the rapid development of generative technology, current generative
models can generate high-fidelity digital content and edit it in a controlled
manner. However, there is a risk that malicious individuals might misuse these
capabilities for misleading activities. Although existing research has
attempted to shield photographic images from being manipulated by generative
models, there remains a significant disparity in the protection offered to
video content editing. To bridge the gap, we propose a protection method named
VideoGuard, which can effectively protect videos from unauthorized malicious
editing. This protection is achieved through the subtle introduction of nearly
unnoticeable perturbations that interfere with the functioning of the intended
generative diffusion models. Due to the redundancy between video frames, and
inter-frame attention mechanism in video diffusion models, simply applying
image-based protection methods separately to every video frame can not shield
video from unauthorized editing. To tackle the above challenge, we adopt joint
frame optimization, treating all video frames as an optimization entity.
Furthermore, we extract video motion information and fuse it into optimization
objectives. Thus, these alterations can effectively force the models to produce
outputs that are implausible and inconsistent. We provide a pipeline to
optimize this perturbation. Finally, we use both objective metrics and
subjective metrics to demonstrate the efficacy of our method, and the results
show that the protection performance of VideoGuard is superior to all the
baseline methods.
Ссылки и действия
Дополнительные ресурсы: