Guiding WaveMamba with Frequency Maps for Image Debanding

2508.11331v1 eess.IV, cs.CV 2025-08-19
Авторы:

Xinyi Wang, Smaranda Tasmoc, Nantheera Anantrasirichai, Angeliki Katsenou

Резюме на русском

#### Контекст Modern codecs, применяющиеся для сжатия видео, часто вызывают проблему artefacts, которые называются banding. Эти артефакты характеризуются сглаживанием градиентов цвета, что приводит к потере деталей, особенно в областях с незначительным разнообразием, таких как небо. Это проблема становится особенно актуальной при повторном транскодировании пользовательского контента, где происходит дальнейшее сжатие. Wavelet State Space Model (WSSM), в сочетании с frequency masking map, предлагается для решения этой проблемы. Оно может помочь сохранить детали в высоких частотах, необходимые для того, чтобы восстановить тонкие градиенты и избежать banding. Также, авторы предлагают методику для оценки результатов восстановления banding, которая позволяет сравнивать различные методы в этой области. #### Метод Метод Wavelet State Space Model (WSSM) используется для распаковки изображений на слои с разными частотными параметрами. Затем, изображение оценивается с помощью frequency masking map, которая определяет различные частотные зоны и предлагает подходящий подход для каждой зоны. Модель работает с высокочастотными компонентами, сохраняя детали, которые часто теряются во время сжатия. Это позволяет восстановить тонкие градиенты и улучшить общую качественность изображений. Основной принцип работы заключается в том, что WSSM оценивает градиентную информацию и сохраняет градиентные детали с помощью frequency masking map. #### Результаты Авторы проводили эксперименты с использованием двух открытых датасетов, BAND-2k и BAND-4k, которые являются стандартными для оценки banding. Использованные методы включали не только WSSM, но и другие методы, такие как DBCNN и LP-Net. Результаты показали, что WSSM с frequency masking map дает существенное улучшение восстановления, особенно в областях с низким контрастом. Для BAND-2k DBI (Debanding Index) был 0.082, что значительно выше значений других методов. Анализ графических результатов показывает, что статистические меры подтверждают качественные улучшения. Также, авторы предоставили дополнительные результаты по другим изображениям, подтверждающие эффективность их подхода. #### Значимость Предлагаемый подход может быть применен в различных областях, где сжатие видео приводит к banding, такие как пользовательский контент, трансляции, видеоредактирование. Особенно полезен для техник, где визуальное качество является критичным, таких как VR, AR, а также для работы с 4K и Ultra-HD контентом. Улучшение качества изображений также может способствовать улучшению user experience при просмотре видео. Этот подход демонстрирует потенциал для улучшения существующих систем сжатия и восстановления, которые применяются в различных приложениях.

Abstract

Compression at low bitrates in modern codecs often introduces banding artifacts, especially in smooth regions such as skies. These artifacts degrade visual quality and are common in user-generated content due to repeated transcoding. We propose a banding restoration method that employs the Wavelet State Space Model and a frequency masking map to preserve high-frequency details. Furthermore, we provide a benchmark of open-source banding restoration methods and evaluate their performance on two public banding image datasets. Experimentation on the available datasets suggests that the proposed post-processing approach effectively suppresses banding compared to the state-of-the-art method (a DBI value of 0.082 on BAND-2k) while preserving image textures. Visual inspections of the results confirm this. Code and supplementary material are available at: https://github.com/xinyiW915/Debanding-PCS2025.

Ссылки и действия