GelSLAM: A Real-time, High-Fidelity, and Robust 3D Tactile SLAM System

2508.15990v1 cs.RO, cs.CV 2025-08-26
Авторы:

Hung-Jui Huang, Mohammad Amin Mirzaee, Michael Kaess, Wenzhen Yuan

Резюме на русском

## Контекст Тактильное восприятие (трогание) является ключевым инструментом для точного удержания и манипулирования объектами. Оно предоставляет преимущества в точности и устойчивости к затенению по сравнению с визуальными методами. Однако использование тактильных данных для построения трехмерных моделей и слежения за движением объектов в пространстве оставалось недостаточно развитым. Это ограничивает возможности тактильных систем в долгосрочной манипуляции с объектами. Многие существующие системы тактильного SLAM (системы ориентирования и картирования) полагаются на точечные облака, которые нередко имеют нестабильность и высокую ошибку в долгосрочном слежении. Наша мотивация заключается в развитии системы, которая будет использовать тактильные данные для достижения высокой точности и долгосрочной стабильности в ориентировании и картировании. ## Метод GelSLAM — это система трехмерного SLAM, основанная на тактильном восприятии, которая получает свои данные из гелевого материала, образующего контакт с объектом. Мы использовали кривую Гесса и нормали к поверхности, извлеченные из тактильных данных, для оценки соответствующих компонент движения. Ключевым элементом стабильности является наш подход к замыканию циклов, который использует наблюдаемые изменения на поверхности для точного восстановления движения даже при низкой текстурности объектов. Архитектура GelSLAM включает в себя модуль, оценивающий компоненты смещения и поворота на основе изменений в плоскости и геометрии объекта, а также модуль для глобального построения карты пространства. Мы тестировали систему на различных материалах, включая низкотекстурные объекты, и получили стабильные и точные результаты. ## Результаты Мы провели ряд экспериментов, которые показали, что GelSLAM обеспечивает реальное время (работает в 30 кадрах в секунду), высокую точность и устойчивость в ориентировании и картировании. Мы сравнили ее с традиционными точечными облаками и доказали, что GelSLAM предлагает значительно лучшую точность при оценке движения и восстановлении формы объекта. Например, для низкотекстурных объектов, таких как деревянные инструменты, GelSLAM показала ошибку менее 0,5 миллиметра в восстановлении формы, что значительно превосходит результаты существующих систем. Мы также продемонстрировали способность GelSLAM следить за движением и восстанавливать форму объекта в реальном времени. ## Значимость Помимо того, что GelSLAM может использоваться для традиционных тактильных задач, таких как восстановление формы и ориентирование, она расширяет возможности тактильного восприятия, обеспечивая долгосрочну

Abstract

Accurately perceiving an object's pose and shape is essential for precise grasping and manipulation. Compared to common vision-based methods, tactile sensing offers advantages in precision and immunity to occlusion when tracking and reconstructing objects in contact. This makes it particularly valuable for in-hand and other high-precision manipulation tasks. In this work, we present GelSLAM, a real-time 3D SLAM system that relies solely on tactile sensing to estimate object pose over long periods and reconstruct object shapes with high fidelity. Unlike traditional point cloud-based approaches, GelSLAM uses tactile-derived surface normals and curvatures for robust tracking and loop closure. It can track object motion in real time with low error and minimal drift, and reconstruct shapes with submillimeter accuracy, even for low-texture objects such as wooden tools. GelSLAM extends tactile sensing beyond local contact to enable global, long-horizon spatial perception, and we believe it will serve as a foundation for many precise manipulation tasks involving interaction with objects in hand. The video demo is available on our website: https://joehjhuang.github.io/gelslam.

Ссылки и действия