Toward Deployable Multi-Robot Collaboration via a Symbolically-Guided Decision Transformer
2508.13877v1
cs.RO, cs.AI
2025-08-21
Авторы:
Rathnam Vidushika Rasanji, Jin Wei-Kocsis, Jiansong Zhang, Dongming Gan, Ragu Athinarayanan, Paul Asunda
Резюме на русском
#### Контекст
Реинфорсментный обучение (RL) стало важной компонентой построения автоматизированных систем, включая роботизированные операции. Однако, его применение в реальном мире сталкивается с рядом проблем, в том числе высокой необходимостью данных, ограниченностью применения в сложных сценариях и неэффективностью в задачах с длительными зависимостями времени. Одна из таких задач — многоробочная манипуляция, требующая системы для выполнения сложных задач с несколькими роботами, которая должна быть интерпретируема, эффективна и настраиваема. Несмотря на то, что Decision Transformers (DTs) показали себя как эффективный подход для научных задач, их применение к многоробочным манипуляциям всё ещё остается недостаточно исследовано.
#### Метод
Мы предлагаем новый подход, основанный на нейро-символической модели, который интегрирует символическую планировку с целевой трансформацией решений. В нашей модели, символический планировщик генерирует высокоуровневый план, который состоит из символических подцелей. Эти подцели используются целевой трансформацией решений для построения низкоуровневых решений в задачах многоробочной манипуляции. Наша модель выделяет сильные стороны как символического планирования, так и методов RL, объединяя их в интегрированную систему. Эта модель позволяет гибко адаптироваться к различным сценариям, в том числе нулевым и нескольким выступлениям.
#### Результаты
Мы оценили нашу модель на различных сценариях задач, включая сценарии с нулевым и несколькими выступлениями. Результаты показали, что SGDT успешно решает задачи многоробочной манипуляции, достигая высокого уровня точности и надежности в различных условиях. Модель демонстрирует высокий уровень интерпретируемости, что делает её пригодной для использования в реальном мире.
#### Значимость
Разработанная модель может быть применена в различных областях, включая автоматизацию производственных процессов, транспортные системы и управление роботами в группах. Одной из основных преимуществ является возможность интеграции символического планирования и RL, что позволяет снизить необходимость в обучении на огромных массивах данных. Это может привести к повышению эффективности и надежности в сложных задачах многоробочной манипуляции.
#### Выводы
Мы представили SGDT, первый подход, использующий нейро-символическую модель для многоробочной манипуляции. Результаты наших экспериментов показали, что модель успешно решает задачи многоробочной манипуляции, обеспечивая высокую точность и интерпретируемость. В будущем мы планируем расширить модель для более сложных задач и исследовать в
Abstract
Reinforcement learning (RL) has demonstrated great potential in robotic
operations. However, its data-intensive nature and reliance on the Markov
Decision Process (MDP) assumption limit its practical deployment in real-world
scenarios involving complex dynamics and long-term temporal dependencies, such
as multi-robot manipulation. Decision Transformers (DTs) have emerged as a
promising offline alternative by leveraging causal transformers for sequence
modeling in RL tasks. However, their applications to multi-robot manipulations
still remain underexplored. To address this gap, we propose a novel framework,
Symbolically-Guided Decision Transformer (SGDT), which integrates a
neuro-symbolic mechanism with a causal transformer to enable deployable
multi-robot collaboration. In the proposed SGDT framework, a neuro-symbolic
planner generates a high-level task-oriented plan composed of symbolic
subgoals. Guided by these subgoals, a goal-conditioned decision transformer
(GCDT) performs low-level sequential decision-making for multi-robot
manipulation. This hierarchical architecture enables structured, interpretable,
and generalizable decision making in complex multi-robot collaboration tasks.
We evaluate the performance of SGDT across a range of task scenarios, including
zero-shot and few-shot scenarios. To our knowledge, this is the first work to
explore DT-based technology for multi-robot manipulation.
Ссылки и действия
Дополнительные ресурсы: