CSRAP: Enhanced Canvas Attention Scheduling for Real-Time Mission Critical Perception
2508.04976v1
cs.CV
2025-08-09
Авторы:
Md Iftekharul Islam Sakib, Yigong Hu, Tarek Abdelzaher
Резюме на русском
В статье предлагается усовершенствованный подход к управлению вниманием в реальном времени для визуальной прецензии на ресурсораспределенных платформах. Большие высокорезолюционные кадры, необходимые для точного распознавания объектов, представляют серьезную проблему в ситуациях, требующих строгих ограничений по задержке и ресурсам. Ранее предложенный подход к консолидации интересующих зон в упрощенном кадре (канвас-фрейм), допускающий выполнение моделей в режиме реального времени, здесь расширен. Новый подход позволяет использовать кадры разного размера и с другими частотами кадров, увеличивая гибкость и эффективность. Исследования проводились с использованием модели YOLOv11 на платформе NVIDIA Jetson Orin Nano с данными из Waymo Open Dataset. Оценка показала, что дополнительная степень свободы в настройке канвас-фреймов приводит к улучшению точности и достоверности, превзойдя состояние техники в отрасли.
Abstract
Real-time perception on edge platforms faces a core challenge: executing
high-resolution object detection under stringent latency constraints on limited
computing resources. Canvas-based attention scheduling was proposed in earlier
work as a mechanism to reduce the resource demands of perception subsystems. It
consolidates areas of interest in an input data frame onto a smaller area,
called a canvas frame, that can be processed at the requisite frame rate. This
paper extends prior canvas-based attention scheduling literature by (i)
allowing for variable-size canvas frames and (ii) employing selectable canvas
frame rates that may depart from the original data frame rate. We evaluate our
solution by running YOLOv11, as the perception module, on an NVIDIA Jetson Orin
Nano to inspect video frames from the Waymo Open Dataset. Our results show that
the additional degrees of freedom improve the attainable quality/cost
trade-offs, thereby allowing for a consistently higher mean average precision
(mAP) and recall with respect to the state of the art.
Ссылки и действия
Дополнительные ресурсы: