Memory Transfer Planning: LLM-driven Context-Aware Code Adaptation for Robot Manipulation

2509.24160v1 cs.RO, cs.AI, cs.LG 2025-10-01

Авторы:

Tomoyuki Kagaya, Subramanian Lakshmi, Yuxuan Lou, Thong Jing Yuan, Jayashree Karlekar, Sugiri Pranata, Natsuki Murakami, Akira Kinose, Yang You

Резюме на русском

## Контекст Robot manipulation является кллючевым заданием в робототехнике, стремящимся достичь самостоятельного управления изделиями в различных средах. Однако, существующие подходы часто строятся на статичных моделях или требуют конкретной политики для каждой среды, что усложняет адаптацию к новым условиям. Это требует постоянного вмешательства человека, что увеличивает время разработки и снижает масштабируемость. Исследования показывают, что значимое потенциал имеют широко используемые технологии генеративных моделей, такие как Large Language Models (LLMs). Однако, недостаток существующих систем заключается в трудности с извлечением процедурного знания из прошлых опытов, чтобы улучшить систему адаптации в новых средах. ## Метод Мы предлагаем Memory Transfer Planning (MTP), новую фреймворк для LLM-driven planning, который использует процедурное знание, извлеченное из предыдущих успешных примеров кода. Фреймворк MTP работает в трех этапах: 1. **Генерация инициальных планов и кода**: Используя подходящий prompt, LLM сгенерирует исходный план и код для решения задачи. 2. **Извлечение успешных примеров**: Фреймворк извлекает успешные примеры кода из хранилища кода, которые могут быть использованы в новой среде. 3. **Контекстное адаптирование**: Полученный код адаптируется к новой среде с помощью LLM без изменения моделей или настройки параметров. Эта многоэтапная стратегия позволяет повысить уровень адаптации и передачи знаний между различными средами. ## Результаты Для оценки эффективности MTP, мы проводили эксперименты на трех различных симуляторах: RLBench, CALVIN и на реальном роботе. Мы сравнивали MTP с существующими подходами, такими как запросительная генерация кода, запасное репланирование и традиционные алгоритмы планирования. Результаты показали, что MTP показал существенный выигрыш в успешности и адаптабельности по сравнению с другими подходами, особенно в тех случаях, когда робот должен адаптироваться к новым условиям. Также, мы проверили эффективность MTP в использовании кода, сгенерированного в симуляции, для переноса в реальный мир, и получили положительные результаты. ## Значимость MTP может применяться в различных областях, таких как автоматизация производства, домашние роботы и системы удаленного управления. Одним из основных преимуществ является высокая адаптивность в новых средах, что уменьшает время настройки и требует меньшего вмешательства человека. Этот подход также может увеличить надежность и скорость разработки новых систем управления роботами, что делает его привлекательным для реального применения. ## Выводы MTP представляет собой прод

Abstract

Large language models (LLMs) are increasingly explored in robot manipulation, but many existing methods struggle to adapt to new environments. Many systems require either environment-specific policy training or depend on fixed prompts and single-shot code generation, leading to limited transferability and manual re-tuning. We introduce Memory Transfer Planning (MTP), a framework that leverages successful control-code examples from different environments as procedural knowledge, using them as in-context guidance for LLM-driven planning. Specifically, MTP (i) generates an initial plan and code using LLMs, (ii) retrieves relevant successful examples from a code memory, and (iii) contextually adapts the retrieved code to the target setting for re-planning without updating model parameters. We evaluate MTP on RLBench, CALVIN, and a physical robot, demonstrating effectiveness beyond simulation. Across these settings, MTP consistently improved success rate and adaptability compared with fixed-prompt code generation, naive retrieval, and memory-free re-planning. Furthermore, in hardware experiments, leveraging a memory constructed in simulation proved effective. MTP provides a practical approach that exploits procedural knowledge to realize robust LLM-based planning across diverse robotic manipulation scenarios, enhancing adaptability to novel environments and bridging simulation and real-world deployment.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Memory Transfer Planning: LLM-driven Context-Aware Code Adaptation for Robot Manipulation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Autonomous Reinforcement Learning Robot Control with Intel's Loihi 2 Neuromorphi...

Real-World Reinforcement Learning of Active Perception Behaviors

Real-World Robot Control by Deep Active Inference With a Temporally Hierarchical...

Learning Sim-to-Real Humanoid Locomotion in 15 Minutes

Phase-Adaptive LLM Framework with Multi-Stage Validation for Construction Robot ...

Навигация