HiPlan: Hierarchical Planning for LLM-Based Agents with Adaptive Global-Local Guidance

2508.19076v1 cs.CL, cs.AI 2025-08-28
Авторы:

Ziyue Li, Yuan Chang, Gaihong Yu, Xiaoqiu Le

Резюме на русском

## Контекст Современные large language model (LLM)-based agents показали себя в ситуациях решения задач управления и принятия решений, однако сталкиваются с значительными ограничениями при работе с задачами, требующими долгосрочного планирования. Основная причина этому является отсутствие гибкой и адаптивной структуры планирования, что приводит к неточности действий и неустойчивости в динамичных средах. Это ставит перед исследователями задачу создания более устойчивых и эффективных методов для поддержки сложных задач, где недостаточно простого следования предыдущим действиям. Особенно актуальным становится этот вопрос в сферах, где необходимо сбалансированное сочетание широкомасштабного планирования и точного этапного контроля. ## Метод HiPlan представляет собой инновационную архитектуру, основанную на декомпозиции задач на два уровня: глобальное (макроскопическое) и локальное (микроскопическое) управление. Общая стратегия развития задачи разбивается на "мильтоны" — ключевые моменты, призванные гармонично ориентировать агента. Этот подход позволяет создавать индивидуальные маршруты, ориентируясь на полученные экспертные данные. В ходе выполнения задачи HiPlan использует динамический траекториальный подход: из предыдущих успешных прохождений выбираются паттерны, которые адаптируются в реальном времени для поддержки текущих действий. Это позволяет корректировать ход выполнения и наладить постоянную связь с целевыми объектами. ## Результаты Испытания HiPlan проводились на двух затруднительных бенчмарках, где он показал значительное превосходство перед соревнователями. Оптимизация мильтонов и эффективный механизм адаптации прикладывались к повышению эффективности и стабильности решений. Эксперименты подтверждают, что HiPlan не только улучшает точность решений, но и устойчивость в сложных и непредсказуемых средах. Анализ методов показал, что каждая часть HiPlan — глобальное и локальное управление — сплошь взаимодействуют, внося собственные пользы в общий результат. ## Значимость Предлагаемый подход может применяться в различных областях, таких как управление роботами, логистика, игровой индустрия и даже в сфере самообучающихся систем. Значительным преимуществом HiPlan является его возможность адаптироваться к динамическим условиям и непредсказуемости систем. Это делает его ценным для сценариев, где необходимо не только достичь цели, но и сохранить высокую производительность в условиях неопределенности. ## Выводы Разработанный HiPlan является прорывом в области длительного планирования для LLM-based agents. Он эффективно решает проблем

Abstract

Large language model (LLM)-based agents have demonstrated remarkable capabilities in decision-making tasks, but struggle significantly with complex, long-horizon planning scenarios. This arises from their lack of macroscopic guidance, causing disorientation and failures in complex tasks, as well as insufficient continuous oversight during execution, rendering them unresponsive to environmental changes and prone to deviations. To tackle these challenges, we introduce HiPlan, a hierarchical planning framework that provides adaptive global-local guidance to boost LLM-based agents'decision-making. HiPlan decomposes complex tasks into milestone action guides for general direction and step-wise hints for detailed actions. During the offline phase, we construct a milestone library from expert demonstrations, enabling structured experience reuse by retrieving semantically similar tasks and milestones. In the execution phase, trajectory segments from past milestones are dynamically adapted to generate step-wise hints that align current observations with the milestone objectives, bridging gaps and correcting deviations. Extensive experiments across two challenging benchmarks demonstrate that HiPlan substantially outperforms strong baselines, and ablation studies validate the complementary benefits of its hierarchical components.

Ссылки и действия