Guiding WaveMamba with Frequency Maps for Image Debanding
2508.11331v1
eess.IV, cs.CV
2025-08-19
Авторы:
Xinyi Wang, Smaranda Tasmoc, Nantheera Anantrasirichai, Angeliki Katsenou
Резюме на русском
#### Контекст
Modern codecs, применяющиеся для сжатия видео, часто вызывают проблему artefacts, которые называются banding. Эти артефакты характеризуются сглаживанием градиентов цвета, что приводит к потере деталей, особенно в областях с незначительным разнообразием, таких как небо. Это проблема становится особенно актуальной при повторном транскодировании пользовательского контента, где происходит дальнейшее сжатие. Wavelet State Space Model (WSSM), в сочетании с frequency masking map, предлагается для решения этой проблемы. Оно может помочь сохранить детали в высоких частотах, необходимые для того, чтобы восстановить тонкие градиенты и избежать banding. Также, авторы предлагают методику для оценки результатов восстановления banding, которая позволяет сравнивать различные методы в этой области.
#### Метод
Метод Wavelet State Space Model (WSSM) используется для распаковки изображений на слои с разными частотными параметрами. Затем, изображение оценивается с помощью frequency masking map, которая определяет различные частотные зоны и предлагает подходящий подход для каждой зоны. Модель работает с высокочастотными компонентами, сохраняя детали, которые часто теряются во время сжатия. Это позволяет восстановить тонкие градиенты и улучшить общую качественность изображений. Основной принцип работы заключается в том, что WSSM оценивает градиентную информацию и сохраняет градиентные детали с помощью frequency masking map.
#### Результаты
Авторы проводили эксперименты с использованием двух открытых датасетов, BAND-2k и BAND-4k, которые являются стандартными для оценки banding. Использованные методы включали не только WSSM, но и другие методы, такие как DBCNN и LP-Net. Результаты показали, что WSSM с frequency masking map дает существенное улучшение восстановления, особенно в областях с низким контрастом. Для BAND-2k DBI (Debanding Index) был 0.082, что значительно выше значений других методов. Анализ графических результатов показывает, что статистические меры подтверждают качественные улучшения. Также, авторы предоставили дополнительные результаты по другим изображениям, подтверждающие эффективность их подхода.
#### Значимость
Предлагаемый подход может быть применен в различных областях, где сжатие видео приводит к banding, такие как пользовательский контент, трансляции, видеоредактирование. Особенно полезен для техник, где визуальное качество является критичным, таких как VR, AR, а также для работы с 4K и Ultra-HD контентом. Улучшение качества изображений также может способствовать улучшению user experience при просмотре видео. Этот подход демонстрирует потенциал для улучшения существующих систем сжатия и восстановления, которые применяются в различных приложениях.
Abstract
Compression at low bitrates in modern codecs often introduces banding
artifacts, especially in smooth regions such as skies. These artifacts degrade
visual quality and are common in user-generated content due to repeated
transcoding. We propose a banding restoration method that employs the Wavelet
State Space Model and a frequency masking map to preserve high-frequency
details. Furthermore, we provide a benchmark of open-source banding restoration
methods and evaluate their performance on two public banding image datasets.
Experimentation on the available datasets suggests that the proposed
post-processing approach effectively suppresses banding compared to the
state-of-the-art method (a DBI value of 0.082 on BAND-2k) while preserving
image textures. Visual inspections of the results confirm this. Code and
supplementary material are available at:
https://github.com/xinyiW915/Debanding-PCS2025.
Ссылки и действия
Дополнительные ресурсы: