Scaling Up without Fading Out: Goal-Aware Sparse GNN for RL-based Generalized Planning
2508.10747v1
cs.AI, cs.RO
2025-08-16
Авторы:
Sangwoo Jeon, Juchul Shin, Gyeong-Tae Kim, YeonJe Cho, Seongwoo Kim
Резюме на русском
## Контекст
Generalized planning — это задача автоматического построения решений для широкого класса задач, построенных на основе описаний в PDDL (Planning Domain Definition Language). Несмотря на то, что deep reinforcement learning (RL) и graph neural networks (GNNs) показали себя эффективными в этой области, существуют значительные проблемы. Основная трудность заключается в том, что planning states представляются как полносвязные графы, что приводит к затруднению обнаружения локальных зависимостей. Это усложняет обучение моделей в больших или сложных средах, таких как большие грид-среды. Увеличение масштаба задачи приводит к значительной проблеме с памятью и снижению точности. Наша мотивация заключается в разработке метода, который сумеет работать в этих сложных условиях, обеспечивая эффективность и гарантию общей политики.
## Метод
Мы предлагаем **sparse, goal-aware GNN** — совершенно новую архитектуру, которая решает проблемы с памятью и производительностью в задачах generalized planning. Главная идея заключается в том, чтобы сделать представление графа **sparse**, то есть отображать только значимые отношения между узлами, а также добавить **explicit spatial features**, относящиеся к цели. Это позволяет эффективно интегрировать информацию о цели в данные планирования. Модель использует **goal-aware attention**, которая фокусируется на целевых объектах и исключает ненужные детали, снижая затраты памяти и улучшая обучение.
## Результаты
Мы провели эксперименты в созданных PDDL-сценариях, основанных на грид-средах. Наши эксперименты показали, что наш метод **сильно превосходит** существующие подходы в следующих аспектах:
1. **Scale-up without Fading Out**: Модель способна эффективно работать на больших грид-средах, где другие подходы сталкиваются с проблемами с памятью и снижаются в точности.
2. **Improved Policy Generalization**: Наша модель показала значительное улучшение в общей политике, что делает ее применимую к различным задачам в рамках одной среды.
3. **Sparsity and Efficiency**: Мы доказали, что наш алгоритм эффективно использует ресурсы, поддерживая высокую производительность при меньшем потреблении памяти.
## Значимость
Наш метод открывает новые возможности для решения **large-scale generalized planning tasks**. Он может быть применен в различных областях, таких как:
- **Drone Mission Planning**: Ускорение и улучшение работы в сложных средах.
- **Robotics**: Эффективное планирование в средах с неоднородной структурой.
- **Smart Factories**: Увеличение уровня автоматизации и точности в задачах управления производством.
Преимущество нашего подхода заключается в своей **scalability** и **generalization**, что делает его универсальным и применимым в различных классах задач.
## Выводы
Мы представили **Scaling Up without Fading Out: Goal-Aware Sparse GNN for RL-based Generalized Planning**, который является прорывом в об
Abstract
Generalized planning using deep reinforcement learning (RL) combined with
graph neural networks (GNNs) has shown promising results in various symbolic
planning domains described by PDDL. However, existing approaches typically
represent planning states as fully connected graphs, leading to a combinatorial
explosion in edge information and substantial sparsity as problem scales grow,
especially evident in large grid-based environments. This dense representation
results in diluted node-level information, exponentially increases memory
requirements, and ultimately makes learning infeasible for larger-scale
problems. To address these challenges, we propose a sparse, goal-aware GNN
representation that selectively encodes relevant local relationships and
explicitly integrates spatial features related to the goal. We validate our
approach by designing novel drone mission scenarios based on PDDL within a grid
world, effectively simulating realistic mission execution environments. Our
experimental results demonstrate that our method scales effectively to larger
grid sizes previously infeasible with dense graph representations and
substantially improves policy generalization and success rates. Our findings
provide a practical foundation for addressing realistic, large-scale
generalized planning tasks.
Ссылки и действия
Дополнительные ресурсы: