AEGIS: Authenticity Evaluation Benchmark for AI-Generated Video Sequences

2508.10771v1 cs.CV, cs.AI 2025-08-16
Авторы:

Jieyu Li, Xin Zhang, Joey Tianyi Zhou

Резюме на русском

## Контекст Современные достижения в области искусственного интеллекта привели к созданию высокореалистичных синтетических видео, которые могут нарушать цифровую интегритет и доверие к информационным источникам. Отсутствие эффективных методов оценки целостности и аутентичности таких видео становится критическим проблемом. Большинство существующих бенчмарков для оценки аутентичности видео не подходят для современных визуально-языковых моделей, так как отсутствует достаточно высокий уровень реализма, масштаб и сложность. Для решения этой проблемы мы предлагаем AEGIS – новую большую коллекцию для оценки целостности видео, созданную специально для эффективного тестирования современных моделей. ## Метод AEGIS состоит из более чем 10 000 видео, созданных различными современными моделями генерации, такими как Stable Video Diffusion, CogVideoX-5B, KLing и Sora. Эти модели отличаются тем, что они используют разные архитектуры и исходные данные. Бенчмарк включает проверенные реальные видео и синтетические, которые были специально подготовлены для комплексной оценки. Дополнительно, мы предоставили подробные мультимодальные аннотации, такие как Semantic-Authenticity Descriptions, Motion Features и Low-level Visual Features, что позволяет углубиться в анализ технических характеристик видео. ## Результаты Мы проводили эксперименты с использованием визуально-языковых моделей, таких как CLIP и BLIP. Эксперименты показали, что существующие модели сталкиваются с трудностями при оценке самых сложных видео с большим числом семантических особенностей. В частности, новые синтетические видео, включенные в AEGIS, демонстрируют возможности современных моделей синтеза видео, что подтверждает необходимость развития более надежных методов. ## Значимость AEGIS может использоваться во многих областях, таких как мониторинг массовых синтезированных контентов, идентификация фальшивых видео, а также для проведения исследований в области аутентичности видео. Наш бенчмарк предоставляет новые возможности для развития методов и алгоритмов, способных эффективно противостоять новым тенденциям в добавлении фальшивости в видео. В дополнение, мы раскрываем новые вызовы и потенциальные направления для развития моделей, которые должны быть более общеуниверсальными и устойчивыми к различным типам подделки. ## Выводы AEGIS закладывает основу для развития новых методов оценки видеоаутентичности, которые могут стать базой для развития технологий, направленных на защиту от синтетических подделок. Наш бенчмарк является важной инновацией в области обеспечения цифровой безопасности и

Abstract

Recent advances in AI-generated content have fueled the rise of highly realistic synthetic videos, posing severe risks to societal trust and digital integrity. Existing benchmarks for video authenticity detection typically suffer from limited realism, insufficient scale, and inadequate complexity, failing to effectively evaluate modern vision-language models against sophisticated forgeries. To address this critical gap, we introduce AEGIS, a novel large-scale benchmark explicitly targeting the detection of hyper-realistic and semantically nuanced AI-generated videos. AEGIS comprises over 10,000 rigorously curated real and synthetic videos generated by diverse, state-of-the-art generative models, including Stable Video Diffusion, CogVideoX-5B, KLing, and Sora, encompassing open-source and proprietary architectures. In particular, AEGIS features specially constructed challenging subsets enhanced with robustness evaluation. Furthermore, we provide multimodal annotations spanning Semantic-Authenticity Descriptions, Motion Features, and Low-level Visual Features, facilitating authenticity detection and supporting downstream tasks such as multimodal fusion and forgery localization. Extensive experiments using advanced vision-language models demonstrate limited detection capabilities on the most challenging subsets of AEGIS, highlighting the dataset's unique complexity and realism beyond the current generalization capabilities of existing models. In essence, AEGIS establishes an indispensable evaluation benchmark, fundamentally advancing research toward developing genuinely robust, reliable, broadly generalizable video authenticity detection methodologies capable of addressing real-world forgery threats. Our dataset is available on https://huggingface.co/datasets/Clarifiedfish/AEGIS.

Ссылки и действия