Neural Algorithmic Reasoners informed Large Language Model for Multi-Agent Path Finding

2508.17971v1 cs.AI, cs.RO 2025-08-27
Авторы:

Pu Feng, Size Wang, Yuhong Cao, Junkang Liang, Rongye Shi, Wenjun Wu

Резюме на русском

## Контекст Multi-agent path finding (MAPF) является относительно недавно исследуемой областью в искусственном интеллекте, которая заключается в управлении несколькими агентами, чтобы они могли перемещаться по карте, избегая коллизий. Эту задачу можно применять в различных сценариях, включая робототехнику, игры с несколькими участниками и управление транспортом. Несмотря на то, что обычные традиционные методы, такие как A* или динамическое программирование, работают достаточно хорошо для MAPF, они часто имеют ограничения в обработке больших данных или сложных сценариев. Однако недавнее развитие больших моделей языка (LLM) позволило использовать их для решения широкого спектра задач, включая MAPF. Однако существуют недостатки в способности LLM решать MAPF, что делает необходимым развитие новых подходов для улучшения их эффективности в таких задачах. ## Метод Мы предлагаем **LLM-NAR (Large Language Model with Neural Algorithmic Reasoner)** — новую архитектуру, которая использует LLM в качестве основы и включает модель графов с нейронными алгоритмическими моделями (NAR) для улучшения производительности в задачах MAPF. Данная модель состоит из трех элементов: **LLM для MAPF**, которая предоставляет базовую модель для обработки языка, **предварительно обученной модели графов с GNN** (Graph Neural Network), которая обрабатывает карту и данные по маршрутам, и **кросс-аттенционной механизмом**, которая помогает LLM и NAR взаимодействовать. Это взаимодействие позволяет LLM использовать графы и карты для более точного планирования. Мы также внедрили адаптивную стратегию обучения, позволяющую LLM-NAR становиться более эффективной при решении сложных задач MAPF. ## Результаты Мы провели ряд экспериментов для оценки эффективности LLM-NAR. Для этого мы использовали две различные среды: симуляционную и реальную, для проверки возможности модели. Мы сравнили LLM-NAR с другими существующими подходами, в том числе с LLM-only моделями и традиционными MAPF-методами. Отчеты показали, что LLM-NAR не только существенно улучшает производительность в сравнении с LLM-only моделями, но и превосходит традиционные MAPF-методы в сложных задачах. В симуляционных и реальных экспериментах LLM-NAR показал высокую точность и эффективность в решении задач, что демонстрирует его высокую применимость в различных сценариях. ## Значимость LLM-NAR может быть применено в различных областях, включая робототехнику, системы управления транспортом и игровые системы. Одним из основных преимуществ является улучшение производительности в задачах MAPF за счет интеграции LLM с нейронными моделями, что позволяет обрабатывать более сложные сценарии. Кроме того, L

Abstract

The development and application of large language models (LLM) have demonstrated that foundational models can be utilized to solve a wide array of tasks. However, their performance in multi-agent path finding (MAPF) tasks has been less than satisfactory, with only a few studies exploring this area. MAPF is a complex problem requiring both planning and multi-agent coordination. To improve the performance of LLM in MAPF tasks, we propose a novel framework, LLM-NAR, which leverages neural algorithmic reasoners (NAR) to inform LLM for MAPF. LLM-NAR consists of three key components: an LLM for MAPF, a pre-trained graph neural network-based NAR, and a cross-attention mechanism. This is the first work to propose using a neural algorithmic reasoner to integrate GNNs with the map information for MAPF, thereby guiding LLM to achieve superior performance. LLM-NAR can be easily adapted to various LLM models. Both simulation and real-world experiments demonstrate that our method significantly outperforms existing LLM-based approaches in solving MAPF problems.

Ссылки и действия