FPG-NAS: FLOPs-Aware Gated Differentiable Neural Architecture Search for Efficient 6DoF Pose Estimation
2508.03618v1
cs.CV
2025-08-09
Авторы:
Nassim Ali Ousalah, Peyman Rostami, Anis Kacem, Enjie Ghorbel, Emmanuel Koumandakis, Djamila Aouada
Резюме на русском
Оптимизация 6DoF-позиционирования объектов является сложной и ресурсоёмкой задачей, требующей эффективных алгоритмов для реального времени. Данная работа представляет FPG-NAS, первый дифференцируемый фреймворк поиска архитектур, ориентированный на FLOPs-оптимизацию для задачи 6DoF-позиционирования. Он использует заданную для этой задачи поисковую пространственность и дифференцируемую механику регуляризации, позволяющую улучшить архитектурную разнообразие и точность. Эксперименты на LINEMOD и SPEED+ показали, что модели, порожденные FPG-NAS, превосходят соревнующиеся методы при ограничении FLOPs. Наша работа демонстрирует, что FPG-NAS может эффективно решать задачи 6DoF-позиционирования в ресурсонедостаточных условиях, устанавливая новый анодный результат в этой области.
Abstract
We introduce FPG-NAS, a FLOPs-aware Gated Differentiable Neural Architecture
Search framework for efficient 6DoF object pose estimation. Estimating 3D
rotation and translation from a single image has been widely investigated yet
remains computationally demanding, limiting applicability in
resource-constrained scenarios. FPG-NAS addresses this by proposing a
specialized differentiable NAS approach for 6DoF pose estimation, featuring a
task-specific search space and a differentiable gating mechanism that enables
discrete multi-candidate operator selection, thus improving architectural
diversity. Additionally, a FLOPs regularization term ensures a balanced
trade-off between accuracy and efficiency. The framework explores a vast search
space of approximately 10\textsuperscript{92} possible architectures.
Experiments on the LINEMOD and SPEED+ datasets demonstrate that FPG-NAS-derived
models outperform previous methods under strict FLOPs constraints. To the best
of our knowledge, FPG-NAS is the first differentiable NAS framework
specifically designed for 6DoF object pose estimation.
Ссылки и действия
Дополнительные ресурсы: