Graph-based Robot Localization Using a Graph Neural Network with a Floor Camera and a Feature Rich Industrial Floor

2508.06177v1 cs.CV, cs.RO 2025-08-12
Авторы:

Dominik Brämer, Diana Kleingarn, Oliver Urbann

Резюме на русском

#### Контекст Навигация роботов является ключевым вопросом в искусственном интеллекте и автоматизации. Одна из самых трудных задач в этой области — точное определение положения робота в пространстве. Для этого широко используются методы, такие как LiDAR, QR-коды и зеркальные системы. Однако, эти системы имеют ограниченную масштабируемость и адаптивность, особенно в сложных пространственных средах. Это приводит к увеличению сложности и затрат при их применении. В настоящей работе предлагается инновационный подход, основанный на графовых представлениях и графных нейронных сетях (Graph Convolutional Networks, GCN), чтобы улучшить точность и эффективность локализации. #### Метод Предлагаемая методология основывается на использовании графовых представлений для описания особенностей пола в пространстве. Именно фотограмметрические свойства пола (например, расположение плит и рисунки) используются для генерации графа, где каждая вершина — это отдельная фича, а рёбра — их связи. Эти графы затем обрабатываются с помощью GCN, чтобы вычислить положение робота в реальном времени. Чтобы повысить точность, особенности каждого кадра из видеопотока действующей камеры используются в качестве входных данных для сети. Эта архитектура позволяет уменьшить ошибку локализации до 0.64 см, что значительно превосходит показатели традиционных систем. #### Результаты В экспериментах использовались данные с робота, оснащенного индустриальным полом с высоким разрешением и фотограмметрическими характеристиками. Для обучения и тестирования GCN использовалась выборка из нескольких тысяч кадров. Результаты показали, что алгоритм достиг точности локализации в 0.64 см, что значительно превышает достижения других методов. Более того, система успешно решала проблему «kidnapped robot problem», что означает точное определение положения в каждом кадре без дополнительных фильтрационных процессов. #### Значимость Предложенный подход может быть применен в различных областях, таких как промышленная автоматизация, помощь незрячим и военной локализации. Одним из основных преимуществ является то, что система может работать в реальном времени без дорогостоящих и сложных фильтрационных процессов. Это открывает новые возможности для более точного, надежного и стойкого к окружению роботов. Будущие исследования будут направлены на улучшение скорости работы, снижение потребления ресурсов и расширение применений в различных типах сред. #### Выводы В итоге, предложенный графовый подход к локализации роботов доказал свою эффективность и превосходство над традиционными методами. Он позволяет повысить точность

Abstract

Accurate localization represents a fundamental challenge in robotic navigation. Traditional methodologies, such as Lidar or QR-code based systems, suffer from inherent scalability and adaptability con straints, particularly in complex environments. In this work, we propose an innovative localization framework that harnesses flooring characteris tics by employing graph-based representations and Graph Convolutional Networks (GCNs). Our method uses graphs to represent floor features, which helps localize the robot more accurately (0.64cm error) and more efficiently than comparing individual image features. Additionally, this approach successfully addresses the kidnapped robot problem in every frame without requiring complex filtering processes. These advancements open up new possibilities for robotic navigation in diverse environments.

Ссылки и действия