Scaling Up without Fading Out: Goal-Aware Sparse GNN for RL-based Generalized Planning

2508.10747v1 cs.AI, cs.RO 2025-08-16

Авторы:

Sangwoo Jeon, Juchul Shin, Gyeong-Tae Kim, YeonJe Cho, Seongwoo Kim

Резюме на русском

## Контекст Generalized planning — это задача автоматического построения решений для широкого класса задач, построенных на основе описаний в PDDL (Planning Domain Definition Language). Несмотря на то, что deep reinforcement learning (RL) и graph neural networks (GNNs) показали себя эффективными в этой области, существуют значительные проблемы. Основная трудность заключается в том, что planning states представляются как полносвязные графы, что приводит к затруднению обнаружения локальных зависимостей. Это усложняет обучение моделей в больших или сложных средах, таких как большие грид-среды. Увеличение масштаба задачи приводит к значительной проблеме с памятью и снижению точности. Наша мотивация заключается в разработке метода, который сумеет работать в этих сложных условиях, обеспечивая эффективность и гарантию общей политики. ## Метод Мы предлагаем **sparse, goal-aware GNN** — совершенно новую архитектуру, которая решает проблемы с памятью и производительностью в задачах generalized planning. Главная идея заключается в том, чтобы сделать представление графа **sparse**, то есть отображать только значимые отношения между узлами, а также добавить **explicit spatial features**, относящиеся к цели. Это позволяет эффективно интегрировать информацию о цели в данные планирования. Модель использует **goal-aware attention**, которая фокусируется на целевых объектах и исключает ненужные детали, снижая затраты памяти и улучшая обучение. ## Результаты Мы провели эксперименты в созданных PDDL-сценариях, основанных на грид-средах. Наши эксперименты показали, что наш метод **сильно превосходит** существующие подходы в следующих аспектах: 1. **Scale-up without Fading Out**: Модель способна эффективно работать на больших грид-средах, где другие подходы сталкиваются с проблемами с памятью и снижаются в точности. 2. **Improved Policy Generalization**: Наша модель показала значительное улучшение в общей политике, что делает ее применимую к различным задачам в рамках одной среды. 3. **Sparsity and Efficiency**: Мы доказали, что наш алгоритм эффективно использует ресурсы, поддерживая высокую производительность при меньшем потреблении памяти. ## Значимость Наш метод открывает новые возможности для решения **large-scale generalized planning tasks**. Он может быть применен в различных областях, таких как: - **Drone Mission Planning**: Ускорение и улучшение работы в сложных средах. - **Robotics**: Эффективное планирование в средах с неоднородной структурой. - **Smart Factories**: Увеличение уровня автоматизации и точности в задачах управления производством. Преимущество нашего подхода заключается в своей **scalability** и **generalization**, что делает его универсальным и применимым в различных классах задач. ## Выводы Мы представили **Scaling Up without Fading Out: Goal-Aware Sparse GNN for RL-based Generalized Planning**, который является прорывом в об

Abstract

Generalized planning using deep reinforcement learning (RL) combined with graph neural networks (GNNs) has shown promising results in various symbolic planning domains described by PDDL. However, existing approaches typically represent planning states as fully connected graphs, leading to a combinatorial explosion in edge information and substantial sparsity as problem scales grow, especially evident in large grid-based environments. This dense representation results in diluted node-level information, exponentially increases memory requirements, and ultimately makes learning infeasible for larger-scale problems. To address these challenges, we propose a sparse, goal-aware GNN representation that selectively encodes relevant local relationships and explicitly integrates spatial features related to the goal. We validate our approach by designing novel drone mission scenarios based on PDDL within a grid world, effectively simulating realistic mission execution environments. Our experimental results demonstrate that our method scales effectively to larger grid sizes previously infeasible with dense graph representations and substantially improves policy generalization and success rates. Our findings provide a practical foundation for addressing realistic, large-scale generalized planning tasks.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Scaling Up without Fading Out: Goal-Aware Sparse GNN for RL-based Generalized Planning

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

MARL Warehouse Robots

SIMA 2: A Generalist Embodied Agent for Virtual Worlds

QuickLAP: Quick Language-Action Preference Learning for Autonomous Driving Agent...

Autonomous Vehicle Path Planning by Searching With Differentiable Simulation

Large Language Model-assisted Autonomous Vehicle Recovery from Immobilization

Навигация