InterKey: Cross-modal Intersection Keypoints for Global Localization on OpenStreetMap
2509.13857v1
cs.RO, cs.CV
2025-09-19
Авторы:
Nguyen Hoang Khoi Tran, Julie Stephany Berrio, Mao Shan, Stewart Worrall
Резюме на русском
#### Контекст
Автоматизированная навигация в автомобилях требует надежной глобальной локализации, особенно в условиях пониженной эффективности систем ГЛОНАССа или их отсутствии, например, в городских узких проездах или в туннелях. Топографические карты, такие как HD-карты, обеспечивают точные предварительные данные, но их создание и поддержание стоит дорого, что ограничивает масштабируемость. OpenStreetMap (OSM) предлагает бесплатный и доступный всем мировому сообществу вариант, однако отсутствие деталей в его абстрактной модели создает проблемы при сопоставлении с данными из сенсоров. Мы предлагаем InterKey, фреймворк, использующий перекрестные точки дорог как уникальные метки для глобальной локализации. Этот подход объединяет анализ данных сенсоров и OSM, создавая эффективные бинарные описания для ключевых точек. Метод также включает стратегии для устранения различий между модальностями, определения ориентации и учета масштаба, чтобы обеспечить точность и надежность.
#### Метод
InterKey основывается на кросс-модальном подходе, который объединяет данные сенсоров и OSM для создания уникальных ключевых точек. Мы используем структурные точки данных, такие как здания и дороги, для построения бинарных описаний. Чтобы устранить различия в модальностях, реализованы три главных стратегии: 1) методы для устранения различий в модальностях, 2) определение ориентации для точного сопоставления, и 3) равномерное выборение областей для уменьшения разброса данных. Эти элементы обеспечивают надежность и масштабируемость фреймворка, даже при работе с неточными данными.
#### Результаты
Мы провели эксперименты на данных KITTI для оценки точности InterKey. Метод показал себя лучше, чем актуальные алгоритмы глобальной локализации, показывая высокую точность в задаче сопоставления между данными сенсоров и OSM. Мы также проверили работу наших методов на разных сенсорах, которые могут генерировать достоверные структурные точки, подтвердив многообразие и масштабируемость InterKey.
#### Значимость
Наш фреймворк может использоваться в различных автоматизированных системах, в том числе в роботов, где требуется стабильная локализация в реальном времени. Особенно проявляется значимость InterKey в случаях, когда GNSS недоступен, что часто встречается в городских условиях. Метод предлагает существенные преимущества в скорости работы, стоимости как для построения карт, так и для навигационных систем.
#### Выводы
Мы представили InterKey, новый метод глобальной локализации, который использует перекрестные точки дорог и OSM для построения надежных описаний. Этот подход демонстрирует высокую точность и м
Abstract
Reliable global localization is critical for autonomous vehicles, especially
in environments where GNSS is degraded or unavailable, such as urban canyons
and tunnels. Although high-definition (HD) maps provide accurate priors, the
cost of data collection, map construction, and maintenance limits scalability.
OpenStreetMap (OSM) offers a free and globally available alternative, but its
coarse abstraction poses challenges for matching with sensor data. We propose
InterKey, a cross-modal framework that leverages road intersections as
distinctive landmarks for global localization. Our method constructs compact
binary descriptors by jointly encoding road and building imprints from point
clouds and OSM. To bridge modality gaps, we introduce discrepancy mitigation,
orientation determination, and area-equalized sampling strategies, enabling
robust cross-modal matching. Experiments on the KITTI dataset demonstrate that
InterKey achieves state-of-the-art accuracy, outperforming recent baselines by
a large margin. The framework generalizes to sensors that can produce dense
structural point clouds, offering a scalable and cost-effective solution for
robust vehicle localization.
Ссылки и действия
Дополнительные ресурсы: