Towards Size-invariant Salient Object Detection: A Generic Evaluation and Optimization Approach

2509.15573v1 cs.CV, cs.AI, cs.LG 2025-09-23

Авторы:

Shilong Bao, Qianqian Xu, Feiran Li, Boyu Han, Zhiyong Yang, Xiaochun Cao, Qingming Huang

Резюме на русском

## Контекст В рамках современных исследований в области классификации и обнаружения объектов в изображениях выделяется проблема размера объектов. Например, в Salient Object Detection (SOD) возникает ситуация, когда в одном изображении присутствуют несколько объектов разных размеров. На основе существующих метрик становится сложно оценить достоверно качество детектора в таких сценариях. Такой подход может привести к ошибкам величины и пропускам менее визуально важных объектов. Данная работа касается именно этой проблемы, авторы предлагают новый взгляд на проблему и предлагают решение с учетом размера объектов. ## Метод Проект предлагает методологию, основанную на разделении задачи SOD на семантические компоненты, каждая из которых характеризуется размером. Для этого авторы предлагают использовать новый фреймворк Size-Invariant Evaluation (SIEva), который эффективно учитывает размеры объектов и уменьшает их влияние на оценку. Для повышения точности обнаружения разработан фреймворк SIOpt, который может быть интегрирован с любыми моделями SOD, независимо от их архитектуры. Авторы также предоставляют анализ общей теоретической модели и разрабатывают новую метрику, которая учитывает размер в зависимости от семантического значения объекта. ## Результаты В ходе экспериментов были оценены различные модели SOD в сценариях с разными размерами объектов. Использовались различные данные, включая COCO, ECSSD и DUTS. Эксперименты показывают, что SIEva и SIOpt улучшают показатели оценки SOD в случаях, когда размеры объектов сильно различаются. Результаты подтверждают, что новый подход действительно снимает несоклькомерную оценку и повышает точность работы моделей SOD в сложных сценариях. ## Значимость Работа имеет большое значение для области SOD, так как решает ключевую проблему текущих метрик. Она может применяться в разных приложениях, где важно обнаруживать объекты разных размеров, например, в робототехнике, медицине и видеоанализе. Новое решение также может способствовать улучшению общей точности и универсальности SOD-моделей. ## Выводы Работа представляет собой важный вклад в улучшение SOD, предлагая новый подход к оценке и оптимизации. Будущие исследования могут сосредоточиться на усовершенствовании фреймворка в зависимости от новых задач и моделей в классификации и обнаружении объектов. Продолжение развития SIOpt в различных сценариях может способствовать расширению применений этой технологии.

Abstract

This paper investigates a fundamental yet underexplored issue in Salient Object Detection (SOD): the size-invariant property for evaluation protocols, particularly in scenarios when multiple salient objects of significantly different sizes appear within a single image. We first present a novel perspective to expose the inherent size sensitivity of existing widely used SOD metrics. Through careful theoretical derivations, we show that the evaluation outcome of an image under current SOD metrics can be essentially decomposed into a sum of several separable terms, with the contribution of each term being directly proportional to its corresponding region size. Consequently, the prediction errors would be dominated by the larger regions, while smaller yet potentially more semantically important objects are often overlooked, leading to biased performance assessments and practical degradation. To address this challenge, a generic Size-Invariant Evaluation (SIEva) framework is proposed. The core idea is to evaluate each separable component individually and then aggregate the results, thereby effectively mitigating the impact of size imbalance across objects. Building upon this, we further develop a dedicated optimization framework (SIOpt), which adheres to the size-invariant principle and significantly enhances the detection of salient objects across a broad range of sizes. Notably, SIOpt is model-agnostic and can be seamlessly integrated with a wide range of SOD backbones. Theoretically, we also present generalization analysis of SOD methods and provide evidence supporting the validity of our new evaluation protocols. Finally, comprehensive experiments speak to the efficacy of our proposed approach. The code is available at https://github.com/Ferry-Li/SI-SOD.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Towards Size-invariant Salient Object Detection: A Generic Evaluation and Optimization Approach

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

PyroFocus: A Deep Learning Approach to Real-Time Wildfire Detection in Multispec...

ProtoEFNet: Dynamic Prototype Learning for Inherently Interpretable Ejection Fra...

GalaxyDiT: Efficient Video Generation with Guidance Alignment and Adaptive Proxy...

Divide, then Ground: Adapting Frame Selection to Query Types for Long-Form Video...

PSA: Pyramid Sparse Attention for Efficient Video Understanding and Generation

Навигация