Enhancing Underwater Images via Deep Learning: A Comparative Study of VGG19 and ResNet50-Based Approaches
2508.17397v2
cs.CV, eess.IV
2025-08-27
Авторы:
Aoqi Li, Yanghui Song, Jichao Dao, Chengfu Yang
Резюме на русском
#### Контекст
Утолщение подводных изображений представляет одну из ключевых задач в области обработки подводных изображений. Такие изображения часто страдают от плохого контраста, суперпозиции цветов и неоднородности помех, что сильно снижает их качество и полезность в приложениях, таких как подводное осмотровочное оборудование, морские экспедиции и системы подводной навигации. Несмотря на развитие технологий, возникают проблемы в достижении высокого качества утолщенных изображений с помощью традиционных методов, таких как фильтры гаусса и лапласианские усиления. Для решения этой проблемы в последние годы возникла интересная область исследований, основывающаяся на глубоком обучении. Для повышения качества подводных изображений в данной работе предлагается использовать две мощные сети с нейронными сетями полного связи (CNN) — VGG19 и ResNet50.
#### Метод
Для утолщения подводных изображений в работе предлагается сочетание двух моделей CNN: VGG19 и ResNet50. Это связано с тем, что VGG19 эффективен в захвате тонких деталей, а ResNet50 — в извлечении глубоких признаков. Для создания модели-фузионера объединяются эти две модели, чтобы учитывать их комплементарность. Во входной части расположены каналы, которые принимают на вход изображения в различных разрешениях. Затем эти каналы проходят через нейронные сети VGG19 и ResNet50, чтобы извлечь признаки. Объединенные выходные данные обрабатываются, чтобы получить утолщенное изображение. Такая архитектура обеспечивает повышение качества изображений, учитывая различные аспекты, такие как границы и цветовая гамма.
#### Результаты
В работе проводились эксперименты с использованием различных данных подводных изображений, включая сцены с различными уровнями загробина, разнообразные цвета и уровни света. Результаты показали, что основная модель, использующая VGG19 и ResNet50, превосходит оба отдельных сети по метрикам качества изображений, таким как PSNR (Peak Signal-to-Noise Ratio) и UCIQE (Underwater Color Image Quality Evaluator). На примерах визуализации показано, что утолщенное изображение, полученное с помощью скомбинированных моделей, имеет более высокий контраст, лучшую цветовую гамму и меньшее количество помех. Это демонстрирует высокую эффективность интегрированного подхода.
#### Значимость
Предлагаемый подход может быть применен в различных областях, включая морские экспедиции, подводную съемку, осмотровочное оборудование и подводные системы навигации. Он обеспечивает преимущества над традиционными методами в виде более точного и качественного утолщения изображений. Благодаря использованию современных техноло
Abstract
This paper addresses the challenging problem of image enhancement in complex
underwater scenes by proposing a solution based on deep learning. The proposed
method skillfully integrates two deep convolutional neural network models,
VGG19 and ResNet50, leveraging their powerful feature extraction capabilities
to perform multi-scale and multi-level deep feature analysis of underwater
images. By constructing a unified model, the complementary advantages of the
two models are effectively integrated, achieving a more comprehensive and
accurate image enhancement effect.To objectively evaluate the enhancement
effect, this paper introduces image quality assessment metrics such as PSNR,
UCIQE, and UIQM to quantitatively compare images before and after enhancement
and deeply analyzes the performance of different models in different
scenarios.Furthermore, to improve the practicality and stability of the
underwater visual enhancement system, this paper also provides practical
suggestions from aspects such as model optimization, multi-model fusion, and
hardware selection, aiming to provide strong technical support for visual
enhancement tasks in complex underwater environments.
Ссылки и действия
Дополнительные ресурсы: