SEBVS: Synthetic Event-based Visual Servoing for Robot Navigation and Manipulation

2508.17643v1 cs.RO, cs.CV 2025-08-27

Авторы:

Krishna Vinod, Prithvi Jai Ramesh, Pavan Kumar B N, Bharatesh Chakravarthi

Резюме на русском

#### Контекст Область исследований, охватывающая динамические и реального времени задачи управления роботами, широко распространена в современных робототехнических системах. Одним из ключевых аспектов этой области является создание эффективных методов визуального сервирования (visual servoing) для обеспечения точного и реактивного управления. Роботы, оперирующие в реальном времени, должны быть высокоточными в понимании и реагировании на свое окружение. Это становится особенно важно при работе в условиях, которые могут быть нестандартными — таких как быстрые изменения освещения, моторный шум или цензурные препятствия. Одним из самых обещающих подходов для решения этих проблем являются event-based vision системы. Эти системы используют event cameras, которые предлагают микросекундную задержку, высокую динамику диапазона и низкое энергопотребление. Однако, несмотря на эти преимущества, использование event cameras в области robotic policy learning и synthetic event-based vision все еще остается необоснованным в многих стандартных робототехнических симуляторах. Это ограничение существенно снижает возможность проверки и оптимизации event-driven политик в реальном времени. #### Метод В данной работе представлен SEBVS (Synthetic Event-based Visual Servoing) — современный подход к синтетическому event-based vision, ориентированный на поддержку robotic policy learning. SEBVS является открытым исходным кодом и является основополагающим пакетом для ROS (Robot Operating System) в симуляторе Gazebo. Он позволяет генерировать event streams из RGB-камер, что делает его идеальным инструментом для моделирования и экспериментирования с event-based systems в реальном времени. Этот подход предоставляет платфоrmу для тренировки, оценки и оптимизации event-driven политик в различных сценариях — от обычного обнаружения и слежения за объектом до более сложного обнаружения, захвата и манипулирования. SEBVS также поддерживает поведенческое копирование (behavior cloning) для тренировки transformer-based event-driven политик. Этот подход позволяет создавать эффективные модели для обработки event-based сигналов и их интеграции в роботские системы. #### Результаты Для оценки эффективности SEBVS и event-driven политик были проведены ряд экспериментов в симуляторе Gazebo. Были созданы две основные сценарии: (1) **mobile robot object following** и (2) **robotic manipulator object detection and grasping**. В качестве тестовых данных использовались event streams, сгенерированные SEBVS из RGB-камер. Эти сигналы были использованы для тренировки transformer-based event-driven политик с помощью поведенческого копирования (behavior cloning). Эксперименты показали, что event-driven политики показывают высокую точность и реактивность, даже при условиях изменения освещения, моторного шума и затухания. Эти политики также постоянно демонстрируют высокую эффективность по сравнению с RGB-based политиками. #### Значимость Результаты эк

Abstract

Event cameras offer microsecond latency, high dynamic range, and low power consumption, making them ideal for real-time robotic perception under challenging conditions such as motion blur, occlusion, and illumination changes. However, despite their advantages, synthetic event-based vision remains largely unexplored in mainstream robotics simulators. This lack of simulation setup hinders the evaluation of event-driven approaches for robotic manipulation and navigation tasks. This work presents an open-source, user-friendly v2e robotics operating system (ROS) package for Gazebo simulation that enables seamless event stream generation from RGB camera feeds. The package is used to investigate event-based robotic policies (ERP) for real-time navigation and manipulation. Two representative scenarios are evaluated: (1) object following with a mobile robot and (2) object detection and grasping with a robotic manipulator. Transformer-based ERPs are trained by behavior cloning and compared to RGB-based counterparts under various operating conditions. Experimental results show that event-guided policies consistently deliver competitive advantages. The results highlight the potential of event-driven perception to improve real-time robotic navigation and manipulation, providing a foundation for broader integration of event cameras into robotic policy learning. The GitHub repo for the dataset and code: https://eventbasedvision.github.io/SEBVS/

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

SEBVS: Synthetic Event-based Visual Servoing for Robot Navigation and Manipulation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

From Generated Human Videos to Physically Plausible Robot Trajectories

Sign Language Recognition using Bidirectional Reservoir Computing

FOM-Nav: Frontier-Object Maps for Object Goal Navigation

Opening the Sim-to-Real Door for Humanoid Pixel-to-Action Policy Transfer

Estimation of Kinematic Motion from Dashcam Footage

Навигация