Prototype-Driven Structure Synergy Network for Remote Sensing Images Segmentation

2508.04022v1 cs.CV, cs.IR 2025-08-09
Авторы:

Junyi Wang, Jinjiang Li, Guodong Fan, Yakun Ju, Xiang Fang, Alex C. Kot

Резюме на русском

Одной из основных задач в семантической сегментации изображений дистанционного зондирования земли является получение точных и полных результатов, что затрудняется двумя главными проблемами: высокой внутриклассовой вариативностью и высокой межклассовой схожестью. Традиционные методы часто приводят к неполной сегментации из-за неэффективного объединения классовых представлений и неудачного различения похожих фич. Даже алгоритмы, ориентирующиеся на классы, страдают от грубых классовых прототипов и невнимательности к структурной информации. Для решения этих проблем предложен алгоритм Prototype-Driven Structure Synergy Network (PDSSNet). Он основывается на принципе, что полный объект определяется как сочетание неизменных классовых признаков и переменной пространственной структуры. Алгоритм включает три модуля: Adaptive Prototype Extraction Module (APEM) для получения точных классовых прототипов, Semantic-Structure Coordination Module (SSCM) для синхронизации семантики и структуры, и Channel Similarity Adjustment Module (CSAM) для усиления дискриминативности фич. Эксперименты показали, что PDSSNet превосходит современные методы, демонстрируя высокую точность и полноту сегментации. Исходный код доступен по ссылке.

Abstract

In the semantic segmentation of remote sensing images, acquiring complete ground objects is critical for achieving precise analysis. However, this task is severely hindered by two major challenges: high intra-class variance and high inter-class similarity. Traditional methods often yield incomplete segmentation results due to their inability to effectively unify class representations and distinguish between similar features. Even emerging class-guided approaches are limited by coarse class prototype representations and a neglect of target structural information. Therefore, this paper proposes a Prototype-Driven Structure Synergy Network (PDSSNet). The design of this network is based on a core concept, a complete ground object is jointly defined by its invariant class semantics and its variant spatial structure. To implement this, we have designed three key modules. First, the Adaptive Prototype Extraction Module (APEM) ensures semantic accuracy from the source by encoding the ground truth to extract unbiased class prototypes. Subsequently, the designed Semantic-Structure Coordination Module (SSCM) follows a hierarchical semantics-first, structure-second principle. This involves first establishing a global semantic cognition, then leveraging structural information to constrain and refine the semantic representation, thereby ensuring the integrity of class information. Finally, the Channel Similarity Adjustment Module (CSAM) employs a dynamic step-size adjustment mechanism to focus on discriminative features between classes. Extensive experiments demonstrate that PDSSNet outperforms state-of-the-art methods. The source code is available at https://github.com/wangjunyi-1/PDSSNet.

Ссылки и действия