Good Deep Features to Track: Self-Supervised Feature Extraction and Tracking in Visual Odometry
2509.08333v1
cs.RO, cs.CV
2025-09-11
Авторы:
Sai Puneeth Reddy Gottam, Haoming Zhang, Eivydas Keras
Резюме на русском
#### Контекст
Visual-based localization (VBL) широко используется в различных приложениях, включая автоматизированные системы сбора данных, беспилотные летательные аппараты (БЛА) и виртуальная реальность. Однако, несмотря на прогресс в области VBL, его производительность снижается в больших пространственных областях, таких как сети городских проезда и долгосрочные задачи оптического потока. Это приводит к замедлению вычислений и ухудшению точности определения положения. Основные проблемы, вызывающие эти снижения, включают изменения освещения, динамические сцены и зоны с низким контрастом. Такие факторы негативно сказываются на функционировании системы, а также на возможности надёжного и стабильного отслеживания. Мы стремимся решить эти проблемы с помощью продвинутого метода, который основывается на самосупервизованном обучении, чтобы обеспечить более прочные и информативные функции, чтобы повысить надежность и точность VBL в сложных средах.
#### Метод
Мы предлагаем метод, основанный на самосупервизованном обучении, чтобы повысить качество функций визуального отслеживания. Наш подход включает два этапа: экстракция и отслеживание. В первом этапе мы используем самосупервизованную функцию для извлечения визуальных признаков, которые направлены на создание более стабильных и информативных данных. Это позволяет значительно повысить точность и надежность в сложных условиях. Во втором этапе мы используем динамическую модель для отслеживания этих признаков в пространстве. Мы также внедряем техники, которые обеспечивают взаимодействие между этими двумя этапами, чтобы обеспечить стабильность и улучшение общей производительности. Эта архитектура позволяет нашему методу быть прочным и производительным в различных условиях, включая темные, яркие и динамические сцены.
#### Результаты
Мы провели ряд экспериментов для оценки нашего метода. Для этого мы использовали данные из наборов KITTI и TUM-RGBD. Наши эксперименты показали, что наш метод превосходит существующие другие технологии в области VBL по многим критериям, включая стабильность отслеживания, точность и общую производительность. Мы также проверили нашу модель на наборах данных с темными и яркими условиями, а также на сценах с низким контрастом и динамичными объектами. Результаты показывают, что наш метод обеспечивает значительное улучшение в сравнении с другими методами, что делает его более надежным и эффективным для использования в реальных ситуациях.
#### Значимость
Метод, представленный в нашей работе, имеет широкие перспективы применения в различных областях, включая автоматизиро
Abstract
Visual-based localization has made significant progress, yet its performance
often drops in large-scale, outdoor, and long-term settings due to factors like
lighting changes, dynamic scenes, and low-texture areas. These challenges
degrade feature extraction and tracking, which are critical for accurate motion
estimation. While learning-based methods such as SuperPoint and SuperGlue show
improved feature coverage and robustness, they still face generalization issues
with out-of-distribution data. We address this by enhancing deep feature
extraction and tracking through self-supervised learning with task specific
feedback. Our method promotes stable and informative features, improving
generalization and reliability in challenging environments.
Ссылки и действия
Дополнительные ресурсы: