ShortCheck: Checkworthiness Detection of Multilingual Short-Form Videos
2509.20467v1
cs.CL, cs.CV
2025-09-26
Авторы:
Henrik Vatndal, Vinay Setty
Резюме на русском
## Контекст
Платформы для создания коротких видео, такие как TikTok, характеризуются своей мультимодальностью, динамичностью и шумностью содержимого. Эти особенности создают значительные вызовы для автоматизированных систем, предназначенных для обнаружения неточностей или недостоверных сведений. Однако исследователи отлично понимают, насколько важно иметь инструменты, которые могут помочь пользователям или факт-чекерам быстро и эффективно определить, какие видео требуют дополнительного анализа. На данный момент существуют несколько систем, предназначенных для работы с длинными текстовыми документами, однако инструменты, созданные специально для работы с короткими видео, довольно редки.
## Метод
Предлагаемый подход, ShortCheck, представляет собой модульную систему, работающую только на основе инференции. Основные компоненты системы включают в себя систему транскрибирования речи, распознавание текста на изображениях (OCR), обнаружение объектов, детектор deepfake, генерацию текстовой суммаризации, а также механизм верификации утверждений. Каждый модуль работает с отдельным аспектом видео, объединяя свои результаты в полное видео-суммари. Модель обучена на данных, относящихся к сфере медиа, что позволяет ей быть эффективной в обработке носителей массовой информации.
## Результаты
Для проверки эффективности ShortCheck проведены эксперименты на двух датасетах, содержащих видео из TikTok. Видео были аннотированы вручную с помощью квалифицированных факт-чекеров, чтобы определить, какие из них требуют дополнительного факт-чекинга. На основе этих данных была проведена оценка модели ShortCheck, и она показала высокую точность, с F1-weighted score более 70%. Это указывает на то, что модель может быть эффективно использована для подбора видео, требующих факт-чекинга.
## Значимость
ShortCheck предлагает значительные преимущества в области обнаружения неточностей в коротких видео. Он может быть использован как поддержка для факт-чекеров в своей работе, а также для разработки новых систем, которые будут применяться в массовых медиа. Например, короткие видео могут использоваться в образовательных, пропагандистских или рекламных целях, где важно быстро определить точность информации. Благодаря модульной структуре, модель может легко адаптироваться к новым задачам и видам контента.
## Выводы
В результате работы исследователи достигли значительных улучшений в области обнаружения неточностей в коротких видео. Основной достижение ShortCheck заключается в том, что он предлагает новый подход к обработке мультимодальных данных в коротких ви
Abstract
Short-form video platforms like TikTok present unique challenges for
misinformation detection due to their multimodal, dynamic, and noisy content.
We present ShortCheck, a modular, inference-only pipeline with a user-friendly
interface that automatically identifies checkworthy short-form videos to help
human fact-checkers. The system integrates speech transcription, OCR, object
and deepfake detection, video-to-text summarization, and claim verification.
ShortCheck is validated by evaluating it on two manually annotated datasets
with TikTok videos in a multilingual setting. The pipeline achieves promising
results with F1-weighted score over 70\%.
Ссылки и действия
Дополнительные ресурсы: