SoccerHigh: A Benchmark Dataset for Automatic Soccer Video Summarization
2509.01439v1
cs.CV, cs.AI, cs.MM
2025-09-05
Авторы:
Artur Díaz-Juan, Coloma Ballester, Gloria Haro
Резюме на русском
## Контекст
Видео-суммирование — это задача, которая заключается в извлечении ключевых моментов из длинных видеозаписей для создания краткой, но информативной суммарной версии. Одной из наиболее распространенных областей применения этой задачи является спорт, где выделенные моменты (highlight reels) позволяют показать наиболее важные события матча, реакции игроков и конкретные контекстуальные моменты. Автоматическое генерирование таких суммарий может значительно упростить работу спортивных редакторов, сократив время и усилия, необходимые для выделения ключевых моментов. Однако существующая проблема заключается в отсутствии доступных для общественности данных, которые могли бы поддерживать развитие эффективных моделей для генерирования выделенных моментов в спортивных видео. Для устранения этой проблемы в данной работе представлена новая, кураторски созданная база данных SoccerHigh, которая предназначена для задачи автоматического суммирования видео в сфере спорта, а именно, в футболе.
## Метод
База данных SoccerHigh была создана на основе широко известной базы данных SoccerNet и включает в себя 237 записанных матчей из трех крупных лиг — Испании, Франции и Италии. Для каждого матча были извлечены границы кадров (shot boundaries), что позволяет разделить видео на отдельные моменты. Базовая модель, предложенная в работе, была специально разработана для этой задачи и использует техники нейронных сетей для выделения ключевых моментов в видео. Для более точной оценки качества генерируемых суммариев была разработана новая метрика, учитывающая ограничение длины каждого извлеченного момента. Эта метрика позволяет провести более строгий и объективный анализ результатов.
## Результаты
Используя предложенную базу данных SoccerHigh, была проведена крупномасштабная экспериментальная часть, в которой была оценена эффективность базовой модели. Основной показатель — F1-меру — для тестовой выборки составил 0.3956. Это свидетельствует о начальной эффективности модели в выделении ключевых моментов. Более того, новая метрика позволила повысить точность и четкость оценки, учитывая ограничение длины каждого выделенного момента. Это делает разработанную метрику более целесообразной для оценки моделей, специально разработанных для генерирования выделенных моментов в спортивных видео.
## Значимость
Область применения данной базы данных и разработанного подхода очень широка. Она может быть использована в сфере спортивных медиа, где выделенные моменты играют ключевую роль в создании хайлайтов матчей. Благодаря разработанной модели, можно сократить время и усилия, необходимые для выделения ключевых моментов, что позволит экономить рес
Abstract
Video summarization aims to extract key shots from longer videos to produce
concise and informative summaries. One of its most common applications is in
sports, where highlight reels capture the most important moments of a game,
along with notable reactions and specific contextual events. Automatic summary
generation can support video editors in the sports media industry by reducing
the time and effort required to identify key segments. However, the lack of
publicly available datasets poses a challenge in developing robust models for
sports highlight generation. In this paper, we address this gap by introducing
a curated dataset for soccer video summarization, designed to serve as a
benchmark for the task. The dataset includes shot boundaries for 237 matches
from the Spanish, French, and Italian leagues, using broadcast footage sourced
from the SoccerNet dataset. Alongside the dataset, we propose a baseline model
specifically designed for this task, which achieves an F1 score of 0.3956 in
the test set. Furthermore, we propose a new metric constrained by the length of
each target summary, enabling a more objective evaluation of the generated
content. The dataset and code are available at
https://ipcv.github.io/SoccerHigh/.
Ссылки и действия
Дополнительные ресурсы: