TranTac: Leveraging Transient Tactile Signals for Contact-Rich Robotic Manipulation

2509.16550v1 cs.RO, cs.AI, cs.SY, eess.SY 2025-09-25
Авторы:

Yinghao Wu, Shuhong Hou, Haowen Zheng, Yichen Li, Weiyi Lu, Xun Zhou, Yitian Shao

Резюме на русском

## Контекст Современные роботизированные системы для тонких манипуляций часто сталкиваются с ограничениями в осуществлении точных действий, особенно когда визуальная перцепция не может уловить незначительные изменения в положении объекта. Например, в таких задачах, как вставка ключа в замок или подключение USB-устройства, визуальные системы могут недостаточно чувствительны к вибрациям и контактным сигналам, необходимым для точного контроля. Это приводит к неточностям, необходимости повторных попыток и потере времени. Было предложено использовать объемные сенсоры, но они либо медленны, либо требуют слишком много ресурсов. TranTac предлагает решение этой проблемы, объединяя эффективность, точность и недорогие материалы для решения таких задач. ## Метод TranTac основывается на интеграции 6-осевого инерциального измерительного устройства (IMU) в полимерные части робот-гриппера. Этот сенсор наблюдает динамические изменения в положении объекта в течение десятков микросекунд, что позволяет измерить малые движения, невидимые для визуального сенсора. Модель также включает в себя transformer-based encoders, которые обрабатывают данные IMU, и diffusion policy, позволяющую роботу динамически корректировать положение объекта. Эта модель имитирует человеческие движения при вставке, используя динамические корректировки, основанные на временных сенсорных сигналах. ## Результаты TranTac протестирована на вставке примесей, ключей и USB-устройств. Она достигла высокой успешности во вставке с незначительными ошибками, даже если визуальная система не смогла обнаружить несоответствия. Помимо этого, робот смог правильно распознавать контактные точки и корректировать свое положение при наличии видимых деформаций. Также был проведен тест на общую гибкость: после обучения на одной паре отверстий и объекта, TranTac успешно выполнила задачи на неизвестных объектах с чуть менее 70% успешностью. ## Значимость Наиболее заметные преимущества TranTac заключаются в ее способности использовать минимальное количество данных для точного управления, что делает ее привлекательной для систем с ограниченными ресурсами. Ее можно применять в сфере robot-саунд, где точность и эффективность сенсорных сигналов критичны. Эта модель также может быть применена в реальных ситуациях, таких как туннельные инструменты для медицинских целей или роботы для сборки тонких соединений. Такое решение может существенно улучшить точность и эффективность манипуляций в технических задачах. ## Выводы TranTac достигла значительных успехов в области тонких манипуляций, показав способность корректировать положение объекта с помощью

Abstract

Robotic manipulation tasks such as inserting a key into a lock or plugging a USB device into a port can fail when visual perception is insufficient to detect misalignment. In these situations, touch sensing is crucial for the robot to monitor the task's states and make precise, timely adjustments. Current touch sensing solutions are either insensitive to detect subtle changes or demand excessive sensor data. Here, we introduce TranTac, a data-efficient and low-cost tactile sensing and control framework that integrates a single contact-sensitive 6-axis inertial measurement unit within the elastomeric tips of a robotic gripper for completing fine insertion tasks. Our customized sensing system can detect dynamic translational and torsional deformations at the micrometer scale, enabling the tracking of visually imperceptible pose changes of the grasped object. By leveraging transformer-based encoders and diffusion policy, TranTac can imitate human insertion behaviors using transient tactile cues detected at the gripper's tip during insertion processes. These cues enable the robot to dynamically control and correct the 6-DoF pose of the grasped object. When combined with vision, TranTac achieves an average success rate of 79% on object grasping and insertion tasks, outperforming both vision-only policy and the one augmented with end-effector 6D force/torque sensing. Contact localization performance is also validated through tactile-only misaligned insertion tasks, achieving an average success rate of 88%. We assess the generalizability by training TranTac on a single prism-slot pair and testing it on unseen data, including a USB plug and a metal key, and find that the insertion tasks can still be completed with an average success rate of nearly 70%. The proposed framework may inspire new robotic tactile sensing systems for delicate manipulation tasks.

Ссылки и действия