Prototype-Driven Structure Synergy Network for Remote Sensing Images Segmentation
2508.04022v1
cs.CV, cs.IR
2025-08-09
Авторы:
Junyi Wang, Jinjiang Li, Guodong Fan, Yakun Ju, Xiang Fang, Alex C. Kot
Резюме на русском
Одной из основных задач в семантической сегментации изображений дистанционного зондирования земли является получение точных и полных результатов, что затрудняется двумя главными проблемами: высокой внутриклассовой вариативностью и высокой межклассовой схожестью. Традиционные методы часто приводят к неполной сегментации из-за неэффективного объединения классовых представлений и неудачного различения похожих фич. Даже алгоритмы, ориентирующиеся на классы, страдают от грубых классовых прототипов и невнимательности к структурной информации. Для решения этих проблем предложен алгоритм Prototype-Driven Structure Synergy Network (PDSSNet). Он основывается на принципе, что полный объект определяется как сочетание неизменных классовых признаков и переменной пространственной структуры. Алгоритм включает три модуля: Adaptive Prototype Extraction Module (APEM) для получения точных классовых прототипов, Semantic-Structure Coordination Module (SSCM) для синхронизации семантики и структуры, и Channel Similarity Adjustment Module (CSAM) для усиления дискриминативности фич. Эксперименты показали, что PDSSNet превосходит современные методы, демонстрируя высокую точность и полноту сегментации. Исходный код доступен по ссылке.
Abstract
In the semantic segmentation of remote sensing images, acquiring complete
ground objects is critical for achieving precise analysis. However, this task
is severely hindered by two major challenges: high intra-class variance and
high inter-class similarity. Traditional methods often yield incomplete
segmentation results due to their inability to effectively unify class
representations and distinguish between similar features. Even emerging
class-guided approaches are limited by coarse class prototype representations
and a neglect of target structural information.
Therefore, this paper proposes a Prototype-Driven Structure Synergy Network
(PDSSNet). The design of this network is based on a core concept, a complete
ground object is jointly defined by its invariant class semantics and its
variant spatial structure. To implement this, we have designed three key
modules. First, the Adaptive Prototype Extraction Module (APEM) ensures
semantic accuracy from the source by encoding the ground truth to extract
unbiased class prototypes. Subsequently, the designed Semantic-Structure
Coordination Module (SSCM) follows a hierarchical semantics-first,
structure-second principle. This involves first establishing a global semantic
cognition, then leveraging structural information to constrain and refine the
semantic representation, thereby ensuring the integrity of class information.
Finally, the Channel Similarity Adjustment Module (CSAM) employs a dynamic
step-size adjustment mechanism to focus on discriminative features between
classes.
Extensive experiments demonstrate that PDSSNet outperforms state-of-the-art
methods. The source code is available at
https://github.com/wangjunyi-1/PDSSNet.
Ссылки и действия
Дополнительные ресурсы: