Efficient and Accurate Downfacing Visual Inertial Odometry

2509.10021v1 cs.CV, cs.RO, eess.IV 2025-09-16
Авторы:

Jonas Kühne, Christian Vogt, Michele Magno, Luca Benini

Резюме на русском

#### Контекст Visual Inertial Odometry (VIO) является одной из самых распространенных компьютерно-визуальных технологий, позволяющих определить движение агента с помощью камеры и импульсного гироскопического датчика. Однако существуют проблемы, связанные с двумя ключевыми аспектами: точностью и эффективностью. Недостаточная точность может привести к существенным ошибкам в определении расположения, в то время как высокая сложность вычислительных операций может не позволить применять VIO на микро- и ниано-управляемых авиационных транспортных средствах (micro- и nano-UAVs). Эти проблемы возникают, так как существующие VIO-процессы требуют высокой вычислительной мощности, что не допускается в микроконтроллерах с ограниченными ресурсами. Мотивацией для этого исследования является разработка эффективной и точной VIO-процессной структуры, которая может быть использована на низкоэнергоемких системах. #### Метод Предлагаемая VIO-процессная структура основывается на современных методах трекинга объектов: SuperPoint, PX4FLOW и ORB. Эти методы были оптимизированы и конвертированы в числовые представления для использования на RISC-V-основных системах на микросхемах (SoCs). Также, VIO-процесс использует модель жесткого тела для моделирования движения, что позволяет уменьшить ошибки оценки, особенно в планарных сценариях. Для реализации и эффективности процесса была выбрана система на микросхемах GAP9, известная за свои низкие энергозатраты и высокую производительность. Эта система позволяет реализовать VIO в режиме реального времени, что является ключевым для применения в UAVs. #### Результаты Проведенные эксперименты показали, что использование оптимизированной VIO-процессной структуры приводит к значительному улучшению точности. В частности, при использовании ORB feature tracker, RMSE был снижен на фактор до 3.65x в сравнении с базовой VIO-процессной структурой. Кроме того, PX4FLOW продемонстрировал почти одинаковую точность, но с низким расходом вычислительных ресурсов при движении скоростью менее 24 пикселей в кадре. Это указывает на то, что система может быть применена на устройствах с ограниченными ресурсами без потери качества. #### Значимость Предложенная VIO-структура не только улучшает точность движения, но и открывает новые возможности для использования VIO на микро- и ниано-управляемых авиационных транспортных средствах. Например, эта система может быть использована для навигации в закрытых пространствах, в том числе в пределах помещений или на земле. Благодаря своей эффективности, она также может быть применена в сегменте IoT,

Abstract

Visual Inertial Odometry (VIO) is a widely used computer vision method that determines an agent's movement through a camera and an IMU sensor. This paper presents an efficient and accurate VIO pipeline optimized for applications on micro- and nano-UAVs. The proposed design incorporates state-of-the-art feature detection and tracking methods (SuperPoint, PX4FLOW, ORB), all optimized and quantized for emerging RISC-V-based ultra-low-power parallel systems on chips (SoCs). Furthermore, by employing a rigid body motion model, the pipeline reduces estimation errors and achieves improved accuracy in planar motion scenarios. The pipeline's suitability for real-time VIO is assessed on an ultra-low-power SoC in terms of compute requirements and tracking accuracy after quantization. The pipeline, including the three feature tracking methods, was implemented on the SoC for real-world validation. This design bridges the gap between high-accuracy VIO pipelines that are traditionally run on computationally powerful systems and lightweight implementations suitable for microcontrollers. The optimized pipeline on the GAP9 low-power SoC demonstrates an average reduction in RMSE of up to a factor of 3.65x over the baseline pipeline when using the ORB feature tracker. The analysis of the computational complexity of the feature trackers further shows that PX4FLOW achieves on-par tracking accuracy with ORB at a lower runtime for movement speeds below 24 pixels/frame.

Ссылки и действия

Связанные статьи

Event-guided 3D Gaussian Splatting for Dynamic Human and Scene Reconstruction

## Контекст Проблема реконструкции динамических людей вместе с статическими сценами из монокурсорных видео остается слож...

2025-09-25

L2M-Reg: Building-level Uncertainty-aware Registration of Outdoor LiDAR Point Cl...

## Контекст Область исследования заключается в автоматизированных технологиях для создания урбанистических цифровых двой...

2025-09-24

CoBEVMoE: Heterogeneity-aware Feature Fusion with Dynamic Mixture-of-Experts for...

#### Контекст Коллаборативное восприятие (collaborative perception) — это методика, нацеленная на расширение покрытия д...

2025-09-24

DepTR-MOT: Unveiling the Potential of Depth-Informed Trajectory Refinement for M...

## Контекст Visual Multi-Object Tracking (MOT) является кллючевым компонентом распознавания объектов в системах робототе...

2025-09-24