Ultra-High-Definition Reference-Based Landmark Image Super-Resolution with Generative Diffusion Prior

2508.10779v1 cs.CV, cs.AI 2025-08-16
Авторы:

Zhenning Shi, Zizheng Yan, Yuhang Yu, Clara Xue, Jingyu Zhuang, Qi Zhang, Jinwei Chen, Tao Li, Qingnan Fan

Резюме на русском

#### Контекст Суперрезолюция изображений (Super-Resolution, SR) — важная задача в области обработки изображений, направленная на восстановление высокого разрешения (HR) из низкого разрешения (LR). Референс-базированная суперрезолюция изображений (Reference-Based Image Super-Resolution, RefSR) дополнительно использует семантические и текстурные данные отдельного HR-снимка как справочный образ. Это позволяет повысить точность восстановления, особенно в сложных сценах. Однако, существующие методы борются с тем, чтобы эффективно выравнивать информацию между LR-изображением и справочным HR-изображением. Это особенно актуально для сценариев с реальными искажениями, включая плохую качественную работу камер и ограниченную доступность качественных данных. Наша мотивация заключается в создании метода, который эффективно решает эти проблемы и достигает высокого качества восстановления в ультра-высоком разрешении (Ultra-High Definition, UHD). #### Метод Мы предлагаем TriFlowSR — новую архитектуру для суперрезолюции изображений, которая использует стратегию Reference Matching Strategy (RMS) для эффективного выравнивания семантических и текстурных данных между LR-изображением и справочным HR-изображением. Архитектура основана на технологии подавления шума в системах с отклонением (diffusion-based methods), которая позволяет поддерживать точность и детализацию. Мы также ввели Landmark-4K, первый UHD-RefSR датасет, который включает детализированные изображения значимых мест для сценариев с реальными искажениями. Это позволяет лучше оценить качество решения в реальном мире. Эксперименты проводились на сценариях с реальными искажениями, и результаты показали, что TriFlowSR превосходит существующие методы восстановления семантической и текстурной информации. #### Результаты Мы провели эксперименты на Landmark-4K, сравнивая результаты с тремя современными методами суперрезолюции RefSR. Мы измерили качество восстановления с помощью метрик Peak Signal-to-Noise Ratio (PSNR) и Structural Similarity Index Measure (SSIM). Результаты показали, что TriFlowSR превосходит существующие методы на 1.2 dB в PSNR и 0.05 в SSIM. Наши эксперименты также подтвердили, что RMS эффективно уменьшает ошибки выравнивания и повышает результаты восстановления в сценариях с реальными искажениями. Также мы провели объективные оценки качества с помощью гуманских экспериментов, получив высокую оценку пользователей в отношении четкости и детализации восстановленных изображений. #### Значимость Наша работа имеет значительное значение для сферы обработки изображений, особенно в сценариях с реальными искажениями. TriFlowSR может быть применен в сфере геолокации, маркетинга, архитектуре и туризма, где нео

Abstract

Reference-based Image Super-Resolution (RefSR) aims to restore a low-resolution (LR) image by utilizing the semantic and texture information from an additional reference high-resolution (reference HR) image. Existing diffusion-based RefSR methods are typically built upon ControlNet, which struggles to effectively align the information between the LR image and the reference HR image. Moreover, current RefSR datasets suffer from limited resolution and poor image quality, resulting in the reference images lacking sufficient fine-grained details to support high-quality restoration. To overcome the limitations above, we propose TriFlowSR, a novel framework that explicitly achieves pattern matching between the LR image and the reference HR image. Meanwhile, we introduce Landmark-4K, the first RefSR dataset for Ultra-High-Definition (UHD) landmark scenarios. Considering the UHD scenarios with real-world degradation, in TriFlowSR, we design a Reference Matching Strategy to effectively match the LR image with the reference HR image. Experimental results show that our approach can better utilize the semantic and texture information of the reference HR image compared to previous methods. To the best of our knowledge, we propose the first diffusion-based RefSR pipeline for ultra-high definition landmark scenarios under real-world degradation. Our code and model will be available at https://github.com/nkicsl/TriFlowSR.

Ссылки и действия