Memory Transfer Planning: LLM-driven Context-Aware Code Adaptation for Robot Manipulation
2509.24160v1
cs.RO, cs.AI, cs.LG
2025-10-01
Авторы:
Tomoyuki Kagaya, Subramanian Lakshmi, Yuxuan Lou, Thong Jing Yuan, Jayashree Karlekar, Sugiri Pranata, Natsuki Murakami, Akira Kinose, Yang You
Резюме на русском
## Контекст
Robot manipulation является кллючевым заданием в робототехнике, стремящимся достичь самостоятельного управления изделиями в различных средах. Однако, существующие подходы часто строятся на статичных моделях или требуют конкретной политики для каждой среды, что усложняет адаптацию к новым условиям. Это требует постоянного вмешательства человека, что увеличивает время разработки и снижает масштабируемость. Исследования показывают, что значимое потенциал имеют широко используемые технологии генеративных моделей, такие как Large Language Models (LLMs). Однако, недостаток существующих систем заключается в трудности с извлечением процедурного знания из прошлых опытов, чтобы улучшить систему адаптации в новых средах.
## Метод
Мы предлагаем Memory Transfer Planning (MTP), новую фреймворк для LLM-driven planning, который использует процедурное знание, извлеченное из предыдущих успешных примеров кода. Фреймворк MTP работает в трех этапах:
1. **Генерация инициальных планов и кода**: Используя подходящий prompt, LLM сгенерирует исходный план и код для решения задачи.
2. **Извлечение успешных примеров**: Фреймворк извлекает успешные примеры кода из хранилища кода, которые могут быть использованы в новой среде.
3. **Контекстное адаптирование**: Полученный код адаптируется к новой среде с помощью LLM без изменения моделей или настройки параметров.
Эта многоэтапная стратегия позволяет повысить уровень адаптации и передачи знаний между различными средами.
## Результаты
Для оценки эффективности MTP, мы проводили эксперименты на трех различных симуляторах: RLBench, CALVIN и на реальном роботе. Мы сравнивали MTP с существующими подходами, такими как запросительная генерация кода, запасное репланирование и традиционные алгоритмы планирования. Результаты показали, что MTP показал существенный выигрыш в успешности и адаптабельности по сравнению с другими подходами, особенно в тех случаях, когда робот должен адаптироваться к новым условиям. Также, мы проверили эффективность MTP в использовании кода, сгенерированного в симуляции, для переноса в реальный мир, и получили положительные результаты.
## Значимость
MTP может применяться в различных областях, таких как автоматизация производства, домашние роботы и системы удаленного управления. Одним из основных преимуществ является высокая адаптивность в новых средах, что уменьшает время настройки и требует меньшего вмешательства человека. Этот подход также может увеличить надежность и скорость разработки новых систем управления роботами, что делает его привлекательным для реального применения.
## Выводы
MTP представляет собой прод
Abstract
Large language models (LLMs) are increasingly explored in robot manipulation,
but many existing methods struggle to adapt to new environments. Many systems
require either environment-specific policy training or depend on fixed prompts
and single-shot code generation, leading to limited transferability and manual
re-tuning. We introduce Memory Transfer Planning (MTP), a framework that
leverages successful control-code examples from different environments as
procedural knowledge, using them as in-context guidance for LLM-driven
planning. Specifically, MTP (i) generates an initial plan and code using LLMs,
(ii) retrieves relevant successful examples from a code memory, and (iii)
contextually adapts the retrieved code to the target setting for re-planning
without updating model parameters. We evaluate MTP on RLBench, CALVIN, and a
physical robot, demonstrating effectiveness beyond simulation. Across these
settings, MTP consistently improved success rate and adaptability compared with
fixed-prompt code generation, naive retrieval, and memory-free re-planning.
Furthermore, in hardware experiments, leveraging a memory constructed in
simulation proved effective. MTP provides a practical approach that exploits
procedural knowledge to realize robust LLM-based planning across diverse
robotic manipulation scenarios, enhancing adaptability to novel environments
and bridging simulation and real-world deployment.
Ссылки и действия
Дополнительные ресурсы: