Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

2509.14932v1 cs.RO, cs.LG 2025-09-20

Авторы:

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian Walter

Резюме на русском

## Контекст В последние годы исследования в области робототехники значительно продвинулись благодаря использованию общих, generalist policy, которые упрощают и ускоряют процесс обучения роботов. Однако, существуют ряд проблем, связанных с традиционными фреймворками, которые недостаточно гибки и направлены на специфические задачи. Эти ограничения приводят к трудностям в настройке и переходе от симуляции к реальному миру. Эти проблемы вызывают необходимость в разработке более удобных и мощных средств для эффективной работы с обучением роботов. Объектом исследования является создание модульного и легко расширяемого фреймворка, который может обеспечить эффективное обучение роботов с масштабируемыми generalist policy. ## Метод Robot Control Stack (RCS) представляет собой модульную и легко расширяемую архитектуру, которая предоставляет унифицированный интерфейс для симуляции и реальных роботов. Основные принципы дизайна RCS включают: 1. **Модульность**: Архитектура разделена на слои, что позволяет легко добавлять новые компоненты без изменения основного фреймворка. 2. **Унифицированный интерфейс**: Архитектура обеспечивает единообразный подход для работы с реальными и симулированными роботами. 3. **Масштабируемость**: Фреймворк поддерживает обучение огромных общих политик для роботов с помощью машинного обучения. 4. **Простота**: Фреймворк имеет минимальный набор зависимостей и удобный интерфейс для пользователя. RCS также включает в себя систему оценки, которая позволяет измерить производительность и качество работы роботов в реальном мире и в симуляции. ## Результаты В ходе исследования были проведены несколько экспериментов, используя множество различных роботов и средств обучения. Основные результаты включают: 1. **Оценка производительности**: Был проведен подробный анализ того, насколько эффективно RCS поддерживает обучение различных роботов в разных условиях. 2. **Sim-to-Real transfer**: Было продемонстрировано, насколько хорошо RCS позволяет переходить от симуляции к реальному миру. 3. **Оценка Pi Zero, OpenVLA и Octo**: Изучено, насколько эффективно эти модели работают на разных роботах в разных условиях. ## Значимость RCS представляет собой значительный прорыв в области обучения роботов. Он предоставляет широкие возможности для разработчиков и исследователей, упрощая и ускоряя процессы. Его можно применять в различных областях, включая: 1. **Индустрия**: Эффективное обучение роботов для производственных задач. 2. **Медицина**: Робототехнические системы в медицинских операциях. 3. **Домашний сектор**: Использова

Abstract

Vision-Language-Action models (VLAs) mark a major shift in robot learning. They replace specialized architectures and task-tailored components of expert policies with large-scale data collection and setup-specific fine-tuning. In this machine learning-focused workflow that is centered around models and scalable training, traditional robotics software frameworks become a bottleneck, while robot simulations offer only limited support for transitioning from and to real-world experiments. In this work, we close this gap by introducing Robot Control Stack (RCS), a lean ecosystem designed from the ground up to support research in robot learning with large-scale generalist policies. At its core, RCS features a modular and easily extensible layered architecture with a unified interface for simulated and physical robots, facilitating sim-to-real transfer. Despite its minimal footprint and dependencies, it offers a complete feature set, enabling both real-world experiments and large-scale training in simulation. Our contribution is twofold: First, we introduce the architecture of RCS and explain its design principles. Second, we evaluate its usability and performance along the development cycle of VLA and RL policies. Our experiments also provide an extensive evaluation of Octo, OpenVLA, and Pi Zero on multiple robots and shed light on how simulation data can improve real-world policy performance. Our code, datasets, weights, and videos are available at: https://robotcontrolstack.github.io/

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Cross-embodied Co-design for Dexterous Hands

OmniDexVLG: Learning Dexterous Grasp Generation from Vision Language Model-Guide...

Digital Twin-based Control Co-Design of Full Vehicle Active Suspensions via Deep...

Modality-Augmented Fine-Tuning of Foundation Robot Policies for Cross-Embodiment...

GR-RL: Going Dexterous and Precise for Long-Horizon Robotic Manipulation

Навигация