AEGIS: Authenticity Evaluation Benchmark for AI-Generated Video Sequences
2508.10771v1
cs.CV, cs.AI
2025-08-16
Авторы:
Jieyu Li, Xin Zhang, Joey Tianyi Zhou
Резюме на русском
## Контекст
Современные достижения в области искусственного интеллекта привели к созданию высокореалистичных синтетических видео, которые могут нарушать цифровую интегритет и доверие к информационным источникам. Отсутствие эффективных методов оценки целостности и аутентичности таких видео становится критическим проблемом. Большинство существующих бенчмарков для оценки аутентичности видео не подходят для современных визуально-языковых моделей, так как отсутствует достаточно высокий уровень реализма, масштаб и сложность. Для решения этой проблемы мы предлагаем AEGIS – новую большую коллекцию для оценки целостности видео, созданную специально для эффективного тестирования современных моделей.
## Метод
AEGIS состоит из более чем 10 000 видео, созданных различными современными моделями генерации, такими как Stable Video Diffusion, CogVideoX-5B, KLing и Sora. Эти модели отличаются тем, что они используют разные архитектуры и исходные данные. Бенчмарк включает проверенные реальные видео и синтетические, которые были специально подготовлены для комплексной оценки. Дополнительно, мы предоставили подробные мультимодальные аннотации, такие как Semantic-Authenticity Descriptions, Motion Features и Low-level Visual Features, что позволяет углубиться в анализ технических характеристик видео.
## Результаты
Мы проводили эксперименты с использованием визуально-языковых моделей, таких как CLIP и BLIP. Эксперименты показали, что существующие модели сталкиваются с трудностями при оценке самых сложных видео с большим числом семантических особенностей. В частности, новые синтетические видео, включенные в AEGIS, демонстрируют возможности современных моделей синтеза видео, что подтверждает необходимость развития более надежных методов.
## Значимость
AEGIS может использоваться во многих областях, таких как мониторинг массовых синтезированных контентов, идентификация фальшивых видео, а также для проведения исследований в области аутентичности видео. Наш бенчмарк предоставляет новые возможности для развития методов и алгоритмов, способных эффективно противостоять новым тенденциям в добавлении фальшивости в видео. В дополнение, мы раскрываем новые вызовы и потенциальные направления для развития моделей, которые должны быть более общеуниверсальными и устойчивыми к различным типам подделки.
## Выводы
AEGIS закладывает основу для развития новых методов оценки видеоаутентичности, которые могут стать базой для развития технологий, направленных на защиту от синтетических подделок. Наш бенчмарк является важной инновацией в области обеспечения цифровой безопасности и
Abstract
Recent advances in AI-generated content have fueled the rise of highly
realistic synthetic videos, posing severe risks to societal trust and digital
integrity. Existing benchmarks for video authenticity detection typically
suffer from limited realism, insufficient scale, and inadequate complexity,
failing to effectively evaluate modern vision-language models against
sophisticated forgeries. To address this critical gap, we introduce AEGIS, a
novel large-scale benchmark explicitly targeting the detection of
hyper-realistic and semantically nuanced AI-generated videos. AEGIS comprises
over 10,000 rigorously curated real and synthetic videos generated by diverse,
state-of-the-art generative models, including Stable Video Diffusion,
CogVideoX-5B, KLing, and Sora, encompassing open-source and proprietary
architectures. In particular, AEGIS features specially constructed challenging
subsets enhanced with robustness evaluation. Furthermore, we provide multimodal
annotations spanning Semantic-Authenticity Descriptions, Motion Features, and
Low-level Visual Features, facilitating authenticity detection and supporting
downstream tasks such as multimodal fusion and forgery localization. Extensive
experiments using advanced vision-language models demonstrate limited detection
capabilities on the most challenging subsets of AEGIS, highlighting the
dataset's unique complexity and realism beyond the current generalization
capabilities of existing models. In essence, AEGIS establishes an indispensable
evaluation benchmark, fundamentally advancing research toward developing
genuinely robust, reliable, broadly generalizable video authenticity detection
methodologies capable of addressing real-world forgery threats. Our dataset is
available on https://huggingface.co/datasets/Clarifiedfish/AEGIS.
Ссылки и действия
Дополнительные ресурсы: