Lightweight Multi-Scale Feature Extraction with Fully Connected LMF Layer for Salient Object Detection

2508.07170v1 cs.CV, cs.AI 2025-08-13
Авторы:

Yunpeng Shi, Lei Chen, Xiaolu Shen, Yanju Guo

Резюме на русском

## Контекст Задача поиска наиболее выделенного объекта в изображении, называемая **salient object detection (SOD)**, широко используется в области компьютерного зрения, включая обнаружение объектов, сегментацию изображений и анализ сцен. Однако, эффективная и точная интерпретация изображений чрезвычайно зависит от возможности эффективного извлечения особенностей на разных масштабах. Несмотря на то, что существуют многослойные сети, они часто сталкиваются с проблемами, такими как высокий центровой вес, большое количество параметров и высокий уровень вычислительных затрат. Данная работа посвящена разработке **lightweight** сети, которая может эффективно извлекать многомерные особенности не подвергаясь упомянутым проблемам. ## Метод Методология предложенной работы основывается на разработке **Lightweight Multi-Scale Feature Extraction Layer (LMF)**. Этот слой использует **depthwise separable dilated convolutions** в сочетании с **fully connected** структурой. Это позволяет эффективно извлекать многомерные фичи на разных масштабах, при этом сокращая количество параметров и вычислительных затрат. Для построения **LMFNet** (сеть для SOD), **LMF** слои интегрируются в сеть, чтобы достичь лучшей точности в **salient object detection**. Эта методология значительно сокращает вес сети, сохраняя высокую точность. ## Результаты **LMFNet** была протестирована на пяти различных бенчмарк-датасетах, включая **DUTS**, **ECSSD**, **HKU-IS**, **PASCAL-S** и **SOD**. Результаты показывают, что **LMFNet** достигает **state-of-the-art** или сопоставимых результатов на этих датасетах с **0.81M** параметрами. Эта сеть существенно превосходит традиционные модели по **Efficiency** и **Accuracy**. Таким образом, **LMFNet** эффективно решает проблему **multi-scale feature extraction** в **lightweight** сетях. ## Значимость **LMFNet** может применяться в разных областях **image processing**, таких как **salient object detection**, **video processing** и даже в **medical imaging**. Её преимущества заключаются в **high efficiency**, **low computational cost** и **state-of-the-art performance**. Данная работа открывает новые возможности для **lightweight architectures** в области **computer vision** и может быть применена в будущих исследованиях, связанных с **multi-scale feature extraction**. ## Выводы Разработанная сеть **LMFNet** демонстрирует эффективность в **lightweight multi-scale feature extraction** для **salient object detection**. Она исправляет ранее существующие проблемы, связанные с **efficiency** и **accuracy** в **lightweight networks**. **LMFNet** не только показывает новый подход к **multi-scale feature extraction**, но и открывает пути для будущих исследований в области **image processing** и более широких **computer vision** задач.

Abstract

In the domain of computer vision, multi-scale feature extraction is vital for tasks such as salient object detection. However, achieving this capability in lightweight networks remains challenging due to the trade-off between efficiency and performance. This paper proposes a novel lightweight multi-scale feature extraction layer, termed the LMF layer, which employs depthwise separable dilated convolutions in a fully connected structure. By integrating multiple LMF layers, we develop LMFNet, a lightweight network tailored for salient object detection. Our approach significantly reduces the number of parameters while maintaining competitive performance. Here, we show that LMFNet achieves state-of-the-art or comparable results on five benchmark datasets with only 0.81M parameters, outperforming several traditional and lightweight models in terms of both efficiency and accuracy. Our work not only addresses the challenge of multi-scale learning in lightweight networks but also demonstrates the potential for broader applications in image processing tasks. The related code files are available at https://github.com/Shi-Yun-peng/LMFNet

Ссылки и действия