📊 Статистика дайджестов
Всего дайджестов: 35039 Добавлено сегодня: 432
Последнее обновление: сегодня
📄 AdSum: Two-stream Audio-visual Summarization for Automated Video Advertisement Clipping
2025-11-01Авторы:
Wen Xie, Yanjun Zhu, Gijs Overgoor, Yakov Bart, Agata Lapedriza Garcia, Sarah Ostadabbas
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Advertisers commonly need multiple versions of the same advertisement (ad) at
varying durations for a single campaign. The traditional approach involves
manually selecting and re-editing shots from longer video ads to create shorter
versions, which is labor-intensive and time-consuming. In this paper, we
introduce a framework for automated video ad clipping using video summarization
techniques. We are the first to frame video clipping as a shot selection
problem, tailored specifically for advert...
Авторы:
Fan Hu, Zijie Xin, Xirong Li
**Резюме**
**Проблема:** Ад-хок Video Search (AVS) предполагает использование текстового запроса для поиска видео, отвечающих условию, в большой коллекции неотмеченных коротких видеороликов. Основная сложность заключается в том, что ответные видео могут отличаться сильно по характеристикам, что создает сложности для эффективного поиска. Например, короткий запрос, такой как "Найди видео с танцующими мужчиной и женщиной внутри", может включать в себя видео из разных среды, обстановки и даже стилей (например, ярких залов, теневых баров или черновозного анимации). Таким образом, для покрытия такого широкого круга вариантов необходимо давать результаты, которые будут как можно более разнообразными.
**Решение:** Для улучшения системы поиска и увеличения разнообразия результатов, предлагается новый подход, названный LPD (Learning Partially Decorrelated Common Spaces), который стремится к построению раздельных пространств для каждого из видео и текстовых признаков. Основные новинки в данном подходе заключаются в том, что каждая компонента системы имеет свой собственный пространство, а также в том, что система использует новую форму уровня неравномерности (de-correlation loss) для разнообразия отрицательных выборок внутри каждого пространства. Для обеспечения согласованности между разными пространствами, предлагается использовать информационный метод, основанный на энтропии, чтобы эффективно сформировать общий поисковый пространство.
**Основные выводы:** На основании экспериментов на данных TRECVID AVS (2016-2023), показано, что LPD повышает точность поиска и увеличивает разнообразие результатов. Анализ пространств в LPD также подтверждает, что этот подход эффективно работает на различных видах видео, давая более разнообразные результаты.
Annotation:
Ad-hoc Video Search (AVS) involves using a textual query to search for
multiple relevant videos in a large collection of unlabeled short videos. The
main challenge of AVS is the visual diversity of relevant videos. A simple
query such as "Find shots of a man and a woman dancing together indoors" can
span a multitude of environments, from brightly lit halls and shadowy bars to
dance scenes in black-and-white animations. It is therefore essential to
retrieve relevant videos as comprehensively as p...