RPCANet++: Deep Interpretable Robust PCA for Sparse Object Segmentation

2508.04190v1 cs.CV 2025-08-09

Авторы:

Fengyi Wu, Yimian Dai, Tianfang Zhang, Yixuan Ding, Jian Yang, Ming-Ming Cheng, Zhenming Peng

Резюме на русском

Одной из ключевых задач в обработке изображений является сегментация спарских объектов. Традиционные методы, такие как Robust Principal Component Analysis (RPCA), сталкиваются с ограничениями в производительности и гибкости, включая высокую сложность вычислений, чувствительность к гиперпараметрам и недостаток адаптивности в динамичных условиях. Для решения этих проблем предложена RPCANet++, новая фреймворк для сегментации спарских объектов, который объединяет интерпретируемость RPCA с мощью глубоких нейронных сетей. Реализация RPCANet++ включает модули Background Approximation Module (BAM), Object Extraction Module (OEM) и Image Restoration Module (IRM), способствующими эффективной фильтрации фоновых компонент и выделению объектов. Дополнительно, введено Memory-Augmented Module (MAM) для сохранения объектных признаков и Deep Contrast Prior Module (DCPM) для ускорения выделения объектов. Эксперименты показали, что RPCANet++ превышает современные показатели в работе с различными датасетов. Этот подход также улучшает интерпретируемость результатов с помощью измерений низкоранговых и спарских признаков.

Abstract

Robust principal component analysis (RPCA) decomposes an observation matrix into low-rank background and sparse object components. This capability has enabled its application in tasks ranging from image restoration to segmentation. However, traditional RPCA models suffer from computational burdens caused by matrix operations, reliance on finely tuned hyperparameters, and rigid priors that limit adaptability in dynamic scenarios. To solve these limitations, we propose RPCANet++, a sparse object segmentation framework that fuses the interpretability of RPCA with efficient deep architectures. Our approach unfolds a relaxed RPCA model into a structured network comprising a Background Approximation Module (BAM), an Object Extraction Module (OEM), and an Image Restoration Module (IRM). To mitigate inter-stage transmission loss in the BAM, we introduce a Memory-Augmented Module (MAM) to enhance background feature preservation, while a Deep Contrast Prior Module (DCPM) leverages saliency cues to expedite object extraction. Extensive experiments on diverse datasets demonstrate that RPCANet++ achieves state-of-the-art performance under various imaging scenarios. We further improve interpretability via visual and numerical low-rankness and sparsity measurements. By combining the theoretical strengths of RPCA with the efficiency of deep networks, our approach sets a new baseline for reliable and interpretable sparse object segmentation. Codes are available at our Project Webpage https://fengyiwu98.github.io/rpcanetx.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

RPCANet++: Deep Interpretable Robust PCA for Sparse Object Segmentation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

ViRectify: A Challenging Benchmark for Video Reasoning Correction with Multimoda...

PaCo-RL: Advancing Reinforcement Learning for Consistent Image Generation with P...

ViDiC: Video Difference Captioning

Beyond the Ground Truth: Enhanced Supervision for Image Restoration

TempR1: Improving Temporal Understanding of MLLMs via Temporal-Aware Multi-Task ...

Навигация