Enhancing Underwater Images via Deep Learning: A Comparative Study of VGG19 and ResNet50-Based Approaches

2508.17397v2 cs.CV, eess.IV 2025-08-27
Авторы:

Aoqi Li, Yanghui Song, Jichao Dao, Chengfu Yang

Резюме на русском

#### Контекст Утолщение подводных изображений представляет одну из ключевых задач в области обработки подводных изображений. Такие изображения часто страдают от плохого контраста, суперпозиции цветов и неоднородности помех, что сильно снижает их качество и полезность в приложениях, таких как подводное осмотровочное оборудование, морские экспедиции и системы подводной навигации. Несмотря на развитие технологий, возникают проблемы в достижении высокого качества утолщенных изображений с помощью традиционных методов, таких как фильтры гаусса и лапласианские усиления. Для решения этой проблемы в последние годы возникла интересная область исследований, основывающаяся на глубоком обучении. Для повышения качества подводных изображений в данной работе предлагается использовать две мощные сети с нейронными сетями полного связи (CNN) — VGG19 и ResNet50. #### Метод Для утолщения подводных изображений в работе предлагается сочетание двух моделей CNN: VGG19 и ResNet50. Это связано с тем, что VGG19 эффективен в захвате тонких деталей, а ResNet50 — в извлечении глубоких признаков. Для создания модели-фузионера объединяются эти две модели, чтобы учитывать их комплементарность. Во входной части расположены каналы, которые принимают на вход изображения в различных разрешениях. Затем эти каналы проходят через нейронные сети VGG19 и ResNet50, чтобы извлечь признаки. Объединенные выходные данные обрабатываются, чтобы получить утолщенное изображение. Такая архитектура обеспечивает повышение качества изображений, учитывая различные аспекты, такие как границы и цветовая гамма. #### Результаты В работе проводились эксперименты с использованием различных данных подводных изображений, включая сцены с различными уровнями загробина, разнообразные цвета и уровни света. Результаты показали, что основная модель, использующая VGG19 и ResNet50, превосходит оба отдельных сети по метрикам качества изображений, таким как PSNR (Peak Signal-to-Noise Ratio) и UCIQE (Underwater Color Image Quality Evaluator). На примерах визуализации показано, что утолщенное изображение, полученное с помощью скомбинированных моделей, имеет более высокий контраст, лучшую цветовую гамму и меньшее количество помех. Это демонстрирует высокую эффективность интегрированного подхода. #### Значимость Предлагаемый подход может быть применен в различных областях, включая морские экспедиции, подводную съемку, осмотровочное оборудование и подводные системы навигации. Он обеспечивает преимущества над традиционными методами в виде более точного и качественного утолщения изображений. Благодаря использованию современных техноло

Abstract

This paper addresses the challenging problem of image enhancement in complex underwater scenes by proposing a solution based on deep learning. The proposed method skillfully integrates two deep convolutional neural network models, VGG19 and ResNet50, leveraging their powerful feature extraction capabilities to perform multi-scale and multi-level deep feature analysis of underwater images. By constructing a unified model, the complementary advantages of the two models are effectively integrated, achieving a more comprehensive and accurate image enhancement effect.To objectively evaluate the enhancement effect, this paper introduces image quality assessment metrics such as PSNR, UCIQE, and UIQM to quantitatively compare images before and after enhancement and deeply analyzes the performance of different models in different scenarios.Furthermore, to improve the practicality and stability of the underwater visual enhancement system, this paper also provides practical suggestions from aspects such as model optimization, multi-model fusion, and hardware selection, aiming to provide strong technical support for visual enhancement tasks in complex underwater environments.

Ссылки и действия