Good Deep Features to Track: Self-Supervised Feature Extraction and Tracking in Visual Odometry

2509.08333v1 cs.RO, cs.CV 2025-09-11

Авторы:

Sai Puneeth Reddy Gottam, Haoming Zhang, Eivydas Keras

Резюме на русском

#### Контекст Visual-based localization (VBL) широко используется в различных приложениях, включая автоматизированные системы сбора данных, беспилотные летательные аппараты (БЛА) и виртуальная реальность. Однако, несмотря на прогресс в области VBL, его производительность снижается в больших пространственных областях, таких как сети городских проезда и долгосрочные задачи оптического потока. Это приводит к замедлению вычислений и ухудшению точности определения положения. Основные проблемы, вызывающие эти снижения, включают изменения освещения, динамические сцены и зоны с низким контрастом. Такие факторы негативно сказываются на функционировании системы, а также на возможности надёжного и стабильного отслеживания. Мы стремимся решить эти проблемы с помощью продвинутого метода, который основывается на самосупервизованном обучении, чтобы обеспечить более прочные и информативные функции, чтобы повысить надежность и точность VBL в сложных средах. #### Метод Мы предлагаем метод, основанный на самосупервизованном обучении, чтобы повысить качество функций визуального отслеживания. Наш подход включает два этапа: экстракция и отслеживание. В первом этапе мы используем самосупервизованную функцию для извлечения визуальных признаков, которые направлены на создание более стабильных и информативных данных. Это позволяет значительно повысить точность и надежность в сложных условиях. Во втором этапе мы используем динамическую модель для отслеживания этих признаков в пространстве. Мы также внедряем техники, которые обеспечивают взаимодействие между этими двумя этапами, чтобы обеспечить стабильность и улучшение общей производительности. Эта архитектура позволяет нашему методу быть прочным и производительным в различных условиях, включая темные, яркие и динамические сцены. #### Результаты Мы провели ряд экспериментов для оценки нашего метода. Для этого мы использовали данные из наборов KITTI и TUM-RGBD. Наши эксперименты показали, что наш метод превосходит существующие другие технологии в области VBL по многим критериям, включая стабильность отслеживания, точность и общую производительность. Мы также проверили нашу модель на наборах данных с темными и яркими условиями, а также на сценах с низким контрастом и динамичными объектами. Результаты показывают, что наш метод обеспечивает значительное улучшение в сравнении с другими методами, что делает его более надежным и эффективным для использования в реальных ситуациях. #### Значимость Метод, представленный в нашей работе, имеет широкие перспективы применения в различных областях, включая автоматизиро

Abstract

Visual-based localization has made significant progress, yet its performance often drops in large-scale, outdoor, and long-term settings due to factors like lighting changes, dynamic scenes, and low-texture areas. These challenges degrade feature extraction and tracking, which are critical for accurate motion estimation. While learning-based methods such as SuperPoint and SuperGlue show improved feature coverage and robustness, they still face generalization issues with out-of-distribution data. We address this by enhancing deep feature extraction and tracking through self-supervised learning with task specific feedback. Our method promotes stable and informative features, improving generalization and reliability in challenging environments.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Good Deep Features to Track: Self-Supervised Feature Extraction and Tracking in Visual Odometry

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

From Generated Human Videos to Physically Plausible Robot Trajectories

Sign Language Recognition using Bidirectional Reservoir Computing

FOM-Nav: Frontier-Object Maps for Object Goal Navigation

Opening the Sim-to-Real Door for Humanoid Pixel-to-Action Policy Transfer

Estimation of Kinematic Motion from Dashcam Footage

Навигация