ELHPlan: Efficient Long-Horizon Task Planning for Multi-Agent Collaboration

2509.24230v1 cs.AI, cs.RO 2025-10-01
Авторы:

Shaobin Ling, Yun Wang, Chenyou Fan, Tin Lun Lam, Junjie Hu

Резюме на русском

## Контекст Тактическое задание с участием нескольких агентов (таких как роботы и грузовики) является ключевым задачей в различных областях, включая логистику, производство и исследования. Эти задачи требуют эффективного совместного действия многих агентов для достижения заданных целей. Однако существующие подходы сталкиваются с несколькими проблемами. Декларативные методы, хотя и могут быть гибкими, часто недостаточно адаптируются к динамически меняющимся условиям. Итеративные методы, в свою очередь, требуют очень высоких вычислительных ресурсов, что становится нежелательным при увеличении количества агентов и сложности задач. Мотивация для разработки новых подходов заключается в найдении баланса между эффективностью и эффективностью, обеспечивая возможность решения задач с большим горизонтом времени при ограниченных ресурсах. ## Метод ELHPlan предлагает подход, основанный на концепции Action Chains—серий действий, которые связаны с подстановочными целями. Циклическая структура процесса состоит из четырех этапов: 1) структурирование действий, привязанных к подстановочным целям; 2) проверка на наличие конфликтов и допустимость; 3) корректировка проблем через целевые механизмы; 4) выполнение утвержденных действий. Эта архитектура позволяет достичь эффективности, не прибегая к полному перепланированию. Для эффективного оценивания мульти-агентных систем были разработаны метрики, например, потребление токенов и время планирования. Эти инструменты позволяют лучше определять баланс между эффективностью и производительностью. ## Результаты Исследования проводились на бенчмарке TDW-MAT и C-WAH. Результаты показали, что ELHPlan достигает того же уровня успеха в выполнении задач, но использует лишь 24% токенов, требуемых современными методами. Эти результаты указывают на значительное сокращение вычислительных затрат, не допуская уменьшения качества выполнения задач. Были также проанализированы влияния различных метрик на эффективность планирования, что дало понимание особенностей работы системы в различных условиях. ## Значимость Разработанный подход может быть применен в областях, где необходимо эффективное совместное действие многих агентов, таких как логистические системы, индустрия робототехники и исследования космоса. Особым преимуществом является экономия ресурсов, позволяющая работать с большим числом агентов и сложными задачами без заметного ухудшения качества. Этот подход может повлиять на развитие робототехники, улучшая ее способность решать задачи в

Abstract

Large Language Models (LLMs) enable intelligent multi-robot collaboration but face fundamental trade-offs: declarative methods lack adaptability in dynamic environments, while iterative methods incur prohibitive computational costs that scale poorly with team size and task complexity. In this paper, we propose ELHPlan, a novel framework that introduces Action Chains--sequences of actions explicitly bound to sub-goal intentions--as the fundamental planning primitive. ELHPlan operates via a cyclical process: 1) constructing intention-bound action sequences, 2) proactively validating for conflicts and feasibility, 3) refining issues through targeted mechanisms, and 4) executing validated actions. This design balances adaptability and efficiency by providing sufficient planning horizons while avoiding expensive full re-planning. We further propose comprehensive efficiency metrics, including token consumption and planning time, to more holistically evaluate multi-agent collaboration. Our experiments on benchmark TDW-MAT and C-WAH demonstrate that ELHPlan achieves comparable task success rates while consuming only 24% of the tokens required by state-of-the-art methods. Our research establishes a new efficiency-effectiveness frontier for LLM-based multi-agent planning systems.

Ссылки и действия