CSRAP: Enhanced Canvas Attention Scheduling for Real-Time Mission Critical Perception

2508.04976v1 cs.CV 2025-08-09
Авторы:

Md Iftekharul Islam Sakib, Yigong Hu, Tarek Abdelzaher

Резюме на русском

В статье предлагается усовершенствованный подход к управлению вниманием в реальном времени для визуальной прецензии на ресурсораспределенных платформах. Большие высокорезолюционные кадры, необходимые для точного распознавания объектов, представляют серьезную проблему в ситуациях, требующих строгих ограничений по задержке и ресурсам. Ранее предложенный подход к консолидации интересующих зон в упрощенном кадре (канвас-фрейм), допускающий выполнение моделей в режиме реального времени, здесь расширен. Новый подход позволяет использовать кадры разного размера и с другими частотами кадров, увеличивая гибкость и эффективность. Исследования проводились с использованием модели YOLOv11 на платформе NVIDIA Jetson Orin Nano с данными из Waymo Open Dataset. Оценка показала, что дополнительная степень свободы в настройке канвас-фреймов приводит к улучшению точности и достоверности, превзойдя состояние техники в отрасли.

Abstract

Real-time perception on edge platforms faces a core challenge: executing high-resolution object detection under stringent latency constraints on limited computing resources. Canvas-based attention scheduling was proposed in earlier work as a mechanism to reduce the resource demands of perception subsystems. It consolidates areas of interest in an input data frame onto a smaller area, called a canvas frame, that can be processed at the requisite frame rate. This paper extends prior canvas-based attention scheduling literature by (i) allowing for variable-size canvas frames and (ii) employing selectable canvas frame rates that may depart from the original data frame rate. We evaluate our solution by running YOLOv11, as the perception module, on an NVIDIA Jetson Orin Nano to inspect video frames from the Waymo Open Dataset. Our results show that the additional degrees of freedom improve the attainable quality/cost trade-offs, thereby allowing for a consistently higher mean average precision (mAP) and recall with respect to the state of the art.

Ссылки и действия