Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale
2509.14932v1
cs.RO, cs.LG
2025-09-20
Авторы:
Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian Walter
Резюме на русском
## Контекст
В последние годы исследования в области робототехники значительно продвинулись благодаря использованию общих, generalist policy, которые упрощают и ускоряют процесс обучения роботов. Однако, существуют ряд проблем, связанных с традиционными фреймворками, которые недостаточно гибки и направлены на специфические задачи. Эти ограничения приводят к трудностям в настройке и переходе от симуляции к реальному миру. Эти проблемы вызывают необходимость в разработке более удобных и мощных средств для эффективной работы с обучением роботов. Объектом исследования является создание модульного и легко расширяемого фреймворка, который может обеспечить эффективное обучение роботов с масштабируемыми generalist policy.
## Метод
Robot Control Stack (RCS) представляет собой модульную и легко расширяемую архитектуру, которая предоставляет унифицированный интерфейс для симуляции и реальных роботов. Основные принципы дизайна RCS включают:
1. **Модульность**: Архитектура разделена на слои, что позволяет легко добавлять новые компоненты без изменения основного фреймворка.
2. **Унифицированный интерфейс**: Архитектура обеспечивает единообразный подход для работы с реальными и симулированными роботами.
3. **Масштабируемость**: Фреймворк поддерживает обучение огромных общих политик для роботов с помощью машинного обучения.
4. **Простота**: Фреймворк имеет минимальный набор зависимостей и удобный интерфейс для пользователя.
RCS также включает в себя систему оценки, которая позволяет измерить производительность и качество работы роботов в реальном мире и в симуляции.
## Результаты
В ходе исследования были проведены несколько экспериментов, используя множество различных роботов и средств обучения. Основные результаты включают:
1. **Оценка производительности**: Был проведен подробный анализ того, насколько эффективно RCS поддерживает обучение различных роботов в разных условиях.
2. **Sim-to-Real transfer**: Было продемонстрировано, насколько хорошо RCS позволяет переходить от симуляции к реальному миру.
3. **Оценка Pi Zero, OpenVLA и Octo**: Изучено, насколько эффективно эти модели работают на разных роботах в разных условиях.
## Значимость
RCS представляет собой значительный прорыв в области обучения роботов. Он предоставляет широкие возможности для разработчиков и исследователей, упрощая и ускоряя процессы. Его можно применять в различных областях, включая:
1. **Индустрия**: Эффективное обучение роботов для производственных задач.
2. **Медицина**: Робототехнические системы в медицинских операциях.
3. **Домашний сектор**: Использова
Abstract
Vision-Language-Action models (VLAs) mark a major shift in robot learning.
They replace specialized architectures and task-tailored components of expert
policies with large-scale data collection and setup-specific fine-tuning. In
this machine learning-focused workflow that is centered around models and
scalable training, traditional robotics software frameworks become a
bottleneck, while robot simulations offer only limited support for
transitioning from and to real-world experiments. In this work, we close this
gap by introducing Robot Control Stack (RCS), a lean ecosystem designed from
the ground up to support research in robot learning with large-scale generalist
policies. At its core, RCS features a modular and easily extensible layered
architecture with a unified interface for simulated and physical robots,
facilitating sim-to-real transfer. Despite its minimal footprint and
dependencies, it offers a complete feature set, enabling both real-world
experiments and large-scale training in simulation. Our contribution is
twofold: First, we introduce the architecture of RCS and explain its design
principles. Second, we evaluate its usability and performance along the
development cycle of VLA and RL policies. Our experiments also provide an
extensive evaluation of Octo, OpenVLA, and Pi Zero on multiple robots and shed
light on how simulation data can improve real-world policy performance. Our
code, datasets, weights, and videos are available at:
https://robotcontrolstack.github.io/
Ссылки и действия
Дополнительные ресурсы: