FPG-NAS: FLOPs-Aware Gated Differentiable Neural Architecture Search for Efficient 6DoF Pose Estimation

2508.03618v1 cs.CV 2025-08-09
Авторы:

Nassim Ali Ousalah, Peyman Rostami, Anis Kacem, Enjie Ghorbel, Emmanuel Koumandakis, Djamila Aouada

Резюме на русском

Оптимизация 6DoF-позиционирования объектов является сложной и ресурсоёмкой задачей, требующей эффективных алгоритмов для реального времени. Данная работа представляет FPG-NAS, первый дифференцируемый фреймворк поиска архитектур, ориентированный на FLOPs-оптимизацию для задачи 6DoF-позиционирования. Он использует заданную для этой задачи поисковую пространственность и дифференцируемую механику регуляризации, позволяющую улучшить архитектурную разнообразие и точность. Эксперименты на LINEMOD и SPEED+ показали, что модели, порожденные FPG-NAS, превосходят соревнующиеся методы при ограничении FLOPs. Наша работа демонстрирует, что FPG-NAS может эффективно решать задачи 6DoF-позиционирования в ресурсонедостаточных условиях, устанавливая новый анодный результат в этой области.

Abstract

We introduce FPG-NAS, a FLOPs-aware Gated Differentiable Neural Architecture Search framework for efficient 6DoF object pose estimation. Estimating 3D rotation and translation from a single image has been widely investigated yet remains computationally demanding, limiting applicability in resource-constrained scenarios. FPG-NAS addresses this by proposing a specialized differentiable NAS approach for 6DoF pose estimation, featuring a task-specific search space and a differentiable gating mechanism that enables discrete multi-candidate operator selection, thus improving architectural diversity. Additionally, a FLOPs regularization term ensures a balanced trade-off between accuracy and efficiency. The framework explores a vast search space of approximately 10\textsuperscript{92} possible architectures. Experiments on the LINEMOD and SPEED+ datasets demonstrate that FPG-NAS-derived models outperform previous methods under strict FLOPs constraints. To the best of our knowledge, FPG-NAS is the first differentiable NAS framework specifically designed for 6DoF object pose estimation.

Ссылки и действия