📊 Статистика дайджестов

Всего дайджестов: 35039 Добавлено сегодня: 432

Последнее обновление: сегодня

📄 AdSum: Two-stream Audio-visual Summarization for Automated Video Advertisement Clipping

2025-11-01

Авторы:

Wen Xie, Yanjun Zhu, Gijs Overgoor, Yakov Bart, Agata Lapedriza Garcia, Sarah Ostadabbas

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Advertisers commonly need multiple versions of the same advertisement (ad) at varying durations for a single campaign. The traditional approach involves manually selecting and re-editing shots from longer video ads to create shorter versions, which is labor-intensive and time-consuming. In this paper, we introduce a framework for automated video ad clipping using video summarization techniques. We are the first to frame video clipping as a shot selection problem, tailored specifically for advert...

ID: 2510.26569v1 cs.CV, cs.IR, cs.MM, 68T05, I.4.0; H.3.1; I.2.10; K.4.4

arXiv PDF

📄 Learning Partially-Decorrelated Common Spaces for Ad-hoc Video Search

2025-08-09

Авторы:

Fan Hu, Zijie Xin, Xirong Li

**Резюме** **Проблема:** Ад-хок Video Search (AVS) предполагает использование текстового запроса для поиска видео, отвечающих условию, в большой коллекции неотмеченных коротких видеороликов. Основная сложность заключается в том, что ответные видео могут отличаться сильно по характеристикам, что создает сложности для эффективного поиска. Например, короткий запрос, такой как "Найди видео с танцующими мужчиной и женщиной внутри", может включать в себя видео из разных среды, обстановки и даже стилей (например, ярких залов, теневых баров или черновозного анимации). Таким образом, для покрытия такого широкого круга вариантов необходимо давать результаты, которые будут как можно более разнообразными. **Решение:** Для улучшения системы поиска и увеличения разнообразия результатов, предлагается новый подход, названный LPD (Learning Partially Decorrelated Common Spaces), который стремится к построению раздельных пространств для каждого из видео и текстовых признаков. Основные новинки в данном подходе заключаются в том, что каждая компонента системы имеет свой собственный пространство, а также в том, что система использует новую форму уровня неравномерности (de-correlation loss) для разнообразия отрицательных выборок внутри каждого пространства. Для обеспечения согласованности между разными пространствами, предлагается использовать информационный метод, основанный на энтропии, чтобы эффективно сформировать общий поисковый пространство. **Основные выводы:** На основании экспериментов на данных TRECVID AVS (2016-2023), показано, что LPD повышает точность поиска и увеличивает разнообразие результатов. Анализ пространств в LPD также подтверждает, что этот подход эффективно работает на различных видах видео, давая более разнообразные результаты.

Annotation:

Ad-hoc Video Search (AVS) involves using a textual query to search for multiple relevant videos in a large collection of unlabeled short videos. The main challenge of AVS is the visual diversity of relevant videos. A simple query such as "Find shots of a man and a woman dancing together indoors" can span a multitude of environments, from brightly lit halls and shadowy bars to dance scenes in black-and-white animations. It is therefore essential to retrieve relevant videos as comprehensively as p...

ID: 2508.02340v1 cs.CV, cs.IR, cs.MM

arXiv PDF