OpenDCVCs: A PyTorch Open Source Implementation and Performance Evaluation of the DCVC series Video Codecs

2508.04491v1 eess.IV, cs.CV 2025-08-09
Авторы:

Yichi Zhang, Fengqing Zhu

Резюме на русском

Задача улучшения эффективности кодеков видеокодирования становится все более актуальной в условиях роста требований к качеству видео и ограниченности битрейтов. Одним из перспективных направлений является Deep Contextual Video Compression (DCVC), который использует нейронные сети для повышения эффективности кодирования. Однако ранее доступные реализации DCVC были ограничены возможностями проверки результатов, что затрудняло репликацию исследований и сравнение с другими моделями. В этой работе представлена OpenDCVCs — открытая реализация DCVC на PyTorch, включающая четыре представительских модели DCVC: базовую версию, модель с моделированием временного контекста, с гибридным моделированием энтропии и с использованием разнообразных контекстов. Данная реализация позволяет не только проводить оценку, но и осуществлять полный цикл обучения моделей. Она дополняется документацией, протоколами оценки и результатами сравнения с другими кодеками на разных наборах данных. Это открытие обеспечивает новые возможности для репликации исследований, сравнения алгоритмов и дальнейшего развития DCVC.

Abstract

We present OpenDCVCs, an open-source PyTorch implementation designed to advance reproducible research in learned video compression. OpenDCVCs provides unified and training-ready implementations of four representative Deep Contextual Video Compression (DCVC) models--DCVC, DCVC with Temporal Context Modeling (DCVC-TCM), DCVC with Hybrid Entropy Modeling (DCVC-HEM), and DCVC with Diverse Contexts (DCVC-DC). While the DCVC series achieves substantial bitrate reductions over both classical codecs and advanced learned models, previous public code releases have been limited to evaluation codes, presenting significant barriers to reproducibility, benchmarking, and further development. OpenDCVCs bridges this gap by offering a comprehensive, self-contained framework that supports both end-to-end training and evaluation for all included algorithms. The implementation includes detailed documentation, evaluation protocols, and extensive benchmarking results across diverse datasets, providing a transparent and consistent foundation for comparison and extension. All code and experimental tools are publicly available at https://gitlab.com/viper-purdue/opendcvcs, empowering the community to accelerate research and foster collaboration.

Ссылки и действия