OpenDCVCs: A PyTorch Open Source Implementation and Performance Evaluation of the DCVC series Video Codecs
2508.04491v1
eess.IV, cs.CV
2025-08-09
Авторы:
Yichi Zhang, Fengqing Zhu
Резюме на русском
Задача улучшения эффективности кодеков видеокодирования становится все более актуальной в условиях роста требований к качеству видео и ограниченности битрейтов. Одним из перспективных направлений является Deep Contextual Video Compression (DCVC), который использует нейронные сети для повышения эффективности кодирования. Однако ранее доступные реализации DCVC были ограничены возможностями проверки результатов, что затрудняло репликацию исследований и сравнение с другими моделями.
В этой работе представлена OpenDCVCs — открытая реализация DCVC на PyTorch, включающая четыре представительских модели DCVC: базовую версию, модель с моделированием временного контекста, с гибридным моделированием энтропии и с использованием разнообразных контекстов. Данная реализация позволяет не только проводить оценку, но и осуществлять полный цикл обучения моделей. Она дополняется документацией, протоколами оценки и результатами сравнения с другими кодеками на разных наборах данных. Это открытие обеспечивает новые возможности для репликации исследований, сравнения алгоритмов и дальнейшего развития DCVC.
Abstract
We present OpenDCVCs, an open-source PyTorch implementation designed to
advance reproducible research in learned video compression. OpenDCVCs provides
unified and training-ready implementations of four representative Deep
Contextual Video Compression (DCVC) models--DCVC, DCVC with Temporal Context
Modeling (DCVC-TCM), DCVC with Hybrid Entropy Modeling (DCVC-HEM), and DCVC
with Diverse Contexts (DCVC-DC). While the DCVC series achieves substantial
bitrate reductions over both classical codecs and advanced learned models,
previous public code releases have been limited to evaluation codes, presenting
significant barriers to reproducibility, benchmarking, and further development.
OpenDCVCs bridges this gap by offering a comprehensive, self-contained
framework that supports both end-to-end training and evaluation for all
included algorithms. The implementation includes detailed documentation,
evaluation protocols, and extensive benchmarking results across diverse
datasets, providing a transparent and consistent foundation for comparison and
extension. All code and experimental tools are publicly available at
https://gitlab.com/viper-purdue/opendcvcs, empowering the community to
accelerate research and foster collaboration.
Ссылки и действия
Дополнительные ресурсы: