Towards Size-invariant Salient Object Detection: A Generic Evaluation and Optimization Approach
2509.15573v1
cs.CV, cs.AI, cs.LG
2025-09-23
Авторы:
Shilong Bao, Qianqian Xu, Feiran Li, Boyu Han, Zhiyong Yang, Xiaochun Cao, Qingming Huang
Резюме на русском
## Контекст
В рамках современных исследований в области классификации и обнаружения объектов в изображениях выделяется проблема размера объектов. Например, в Salient Object Detection (SOD) возникает ситуация, когда в одном изображении присутствуют несколько объектов разных размеров. На основе существующих метрик становится сложно оценить достоверно качество детектора в таких сценариях. Такой подход может привести к ошибкам величины и пропускам менее визуально важных объектов. Данная работа касается именно этой проблемы, авторы предлагают новый взгляд на проблему и предлагают решение с учетом размера объектов.
## Метод
Проект предлагает методологию, основанную на разделении задачи SOD на семантические компоненты, каждая из которых характеризуется размером. Для этого авторы предлагают использовать новый фреймворк Size-Invariant Evaluation (SIEva), который эффективно учитывает размеры объектов и уменьшает их влияние на оценку. Для повышения точности обнаружения разработан фреймворк SIOpt, который может быть интегрирован с любыми моделями SOD, независимо от их архитектуры. Авторы также предоставляют анализ общей теоретической модели и разрабатывают новую метрику, которая учитывает размер в зависимости от семантического значения объекта.
## Результаты
В ходе экспериментов были оценены различные модели SOD в сценариях с разными размерами объектов. Использовались различные данные, включая COCO, ECSSD и DUTS. Эксперименты показывают, что SIEva и SIOpt улучшают показатели оценки SOD в случаях, когда размеры объектов сильно различаются. Результаты подтверждают, что новый подход действительно снимает несоклькомерную оценку и повышает точность работы моделей SOD в сложных сценариях.
## Значимость
Работа имеет большое значение для области SOD, так как решает ключевую проблему текущих метрик. Она может применяться в разных приложениях, где важно обнаруживать объекты разных размеров, например, в робототехнике, медицине и видеоанализе. Новое решение также может способствовать улучшению общей точности и универсальности SOD-моделей.
## Выводы
Работа представляет собой важный вклад в улучшение SOD, предлагая новый подход к оценке и оптимизации. Будущие исследования могут сосредоточиться на усовершенствовании фреймворка в зависимости от новых задач и моделей в классификации и обнаружении объектов. Продолжение развития SIOpt в различных сценариях может способствовать расширению применений этой технологии.
Abstract
This paper investigates a fundamental yet underexplored issue in Salient
Object Detection (SOD): the size-invariant property for evaluation protocols,
particularly in scenarios when multiple salient objects of significantly
different sizes appear within a single image. We first present a novel
perspective to expose the inherent size sensitivity of existing widely used SOD
metrics. Through careful theoretical derivations, we show that the evaluation
outcome of an image under current SOD metrics can be essentially decomposed
into a sum of several separable terms, with the contribution of each term being
directly proportional to its corresponding region size. Consequently, the
prediction errors would be dominated by the larger regions, while smaller yet
potentially more semantically important objects are often overlooked, leading
to biased performance assessments and practical degradation. To address this
challenge, a generic Size-Invariant Evaluation (SIEva) framework is proposed.
The core idea is to evaluate each separable component individually and then
aggregate the results, thereby effectively mitigating the impact of size
imbalance across objects. Building upon this, we further develop a dedicated
optimization framework (SIOpt), which adheres to the size-invariant principle
and significantly enhances the detection of salient objects across a broad
range of sizes. Notably, SIOpt is model-agnostic and can be seamlessly
integrated with a wide range of SOD backbones. Theoretically, we also present
generalization analysis of SOD methods and provide evidence supporting the
validity of our new evaluation protocols. Finally, comprehensive experiments
speak to the efficacy of our proposed approach. The code is available at
https://github.com/Ferry-Li/SI-SOD.
Ссылки и действия
Дополнительные ресурсы: