Unleashing the Power of Discrete-Time State Representation: Ultrafast Target-based IMU-Camera Spatial-Temporal Calibration

2509.12846v1 cs.RO, cs.CV 2025-09-18

Авторы:

Junlin Song, Antoine Richard, Miguel Olivares-Mendez

Резюме на русском

#### Контекст Улучшение точности систем визуально-инерциального сервера (VI) является ключевым фактором для развития интеллектуальных и автономных приложений, таких как навигация роботов, поддержка реальности увеличенной (AR) и автопилотирование транспортных средств. Основной проблемой этих систем является точность калибровки спато-временных смещений между инерциальным устройством (IMU) и камерой. Несмотря на то, что существующие методы калибровки, основанные на непрерывном времени и B-spline, обеспечивают высокую точность, они требуют высокой вычислительной нагрузки. Это ограничивает применение этих методов в реальном времени и массовом применении. #### Метод Мы предлагаем новый алгоритм калибровки, основанный на дискретном времени, который обеспечивает эффективность и точность. Метод использует дискретную репрезентацию времени для спато-временных смещений, сокращая вычислительный вес и улучшая скорость выполнения. Мы используем многокамерные системы и IMU для получения точных спато-временных данных. Наши архитектурные решения включают производительные вычисления в реальном времени и интеллектуальную оптимизацию матриц для уменьшения необходимого времени калибровки. #### Результаты Мы провели эксперименты с помощью наших данных и сравнили результаты с другими методами. Наш алгоритм показал существенное сокращение времени калибровки — на до 50% по сравнению с существующими методами. Мы также проанализировали точность наших результатов, показав, что они соответствуют высоким стандартам качества. Для проверки практического применения метода, мы использовали несколько наборов данных, включая динамические сцены, и достигли высокой эффективности. #### Значимость Наш метод может быть применен в различных областях, включая навигацию роботов, системы AR, автоматизированные системы управления транспортными средствами. Несмотря на то, что наш алгоритм нацелен на эффективность, он сохраняет высокую точность, что делает его привлекательным для промышленности. Это также позволяет сэкономить огромное количество времени на калибровке миллионов устройств, что является критически важным для массового применения. #### Выводы Мы успешно развили и проверили новый алгоритм калибровки, основанный на дискретном времени. Этот подход не только сокращает время калибровки, но и улучшает его точность. В будущем мы планируем провести больше экспериментов на различных платформах и расширить возможности нашего кода, чтобы он мог быть полезен как для научных исследований, так и для промышленных приложений.

Abstract

Visual-inertial fusion is crucial for a large amount of intelligent and autonomous applications, such as robot navigation and augmented reality. To bootstrap and achieve optimal state estimation, the spatial-temporal displacements between IMU and cameras must be calibrated in advance. Most existing calibration methods adopt continuous-time state representation, more specifically the B-spline. Despite these methods achieve precise spatial-temporal calibration, they suffer from high computational cost caused by continuous-time state representation. To this end, we propose a novel and extremely efficient calibration method that unleashes the power of discrete-time state representation. Moreover, the weakness of discrete-time state representation in temporal calibration is tackled in this paper. With the increasing production of drones, cellphones and other visual-inertial platforms, if one million devices need calibration around the world, saving one minute for the calibration of each device means saving 2083 work days in total. To benefit both the research and industry communities, our code will be open-source.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Unleashing the Power of Discrete-Time State Representation: Ultrafast Target-based IMU-Camera Spatial-Temporal Calibration

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

From Generated Human Videos to Physically Plausible Robot Trajectories

Sign Language Recognition using Bidirectional Reservoir Computing

FOM-Nav: Frontier-Object Maps for Object Goal Navigation

Opening the Sim-to-Real Door for Humanoid Pixel-to-Action Policy Transfer

Estimation of Kinematic Motion from Dashcam Footage

Навигация