Graph-based Robot Localization Using a Graph Neural Network with a Floor Camera and a Feature Rich Industrial Floor
2508.06177v1
cs.CV, cs.RO
2025-08-12
Авторы:
Dominik Brämer, Diana Kleingarn, Oliver Urbann
Резюме на русском
#### Контекст
Навигация роботов является ключевым вопросом в искусственном интеллекте и автоматизации. Одна из самых трудных задач в этой области — точное определение положения робота в пространстве. Для этого широко используются методы, такие как LiDAR, QR-коды и зеркальные системы. Однако, эти системы имеют ограниченную масштабируемость и адаптивность, особенно в сложных пространственных средах. Это приводит к увеличению сложности и затрат при их применении. В настоящей работе предлагается инновационный подход, основанный на графовых представлениях и графных нейронных сетях (Graph Convolutional Networks, GCN), чтобы улучшить точность и эффективность локализации.
#### Метод
Предлагаемая методология основывается на использовании графовых представлений для описания особенностей пола в пространстве. Именно фотограмметрические свойства пола (например, расположение плит и рисунки) используются для генерации графа, где каждая вершина — это отдельная фича, а рёбра — их связи. Эти графы затем обрабатываются с помощью GCN, чтобы вычислить положение робота в реальном времени. Чтобы повысить точность, особенности каждого кадра из видеопотока действующей камеры используются в качестве входных данных для сети. Эта архитектура позволяет уменьшить ошибку локализации до 0.64 см, что значительно превосходит показатели традиционных систем.
#### Результаты
В экспериментах использовались данные с робота, оснащенного индустриальным полом с высоким разрешением и фотограмметрическими характеристиками. Для обучения и тестирования GCN использовалась выборка из нескольких тысяч кадров. Результаты показали, что алгоритм достиг точности локализации в 0.64 см, что значительно превышает достижения других методов. Более того, система успешно решала проблему «kidnapped robot problem», что означает точное определение положения в каждом кадре без дополнительных фильтрационных процессов.
#### Значимость
Предложенный подход может быть применен в различных областях, таких как промышленная автоматизация, помощь незрячим и военной локализации. Одним из основных преимуществ является то, что система может работать в реальном времени без дорогостоящих и сложных фильтрационных процессов. Это открывает новые возможности для более точного, надежного и стойкого к окружению роботов. Будущие исследования будут направлены на улучшение скорости работы, снижение потребления ресурсов и расширение применений в различных типах сред.
#### Выводы
В итоге, предложенный графовый подход к локализации роботов доказал свою эффективность и превосходство над традиционными методами. Он позволяет повысить точность
Abstract
Accurate localization represents a fundamental challenge in
robotic navigation. Traditional methodologies, such as Lidar or QR-code based
systems, suffer from inherent scalability and adaptability con straints,
particularly in complex environments. In this work, we propose
an innovative localization framework that harnesses flooring characteris tics
by employing graph-based representations and Graph Convolutional
Networks (GCNs). Our method uses graphs to represent floor features,
which helps localize the robot more accurately (0.64cm error) and more
efficiently than comparing individual image features. Additionally, this
approach successfully addresses the kidnapped robot problem in every
frame without requiring complex filtering processes. These advancements
open up new possibilities for robotic navigation in diverse environments.
Ссылки и действия
Дополнительные ресурсы: