Neural Algorithmic Reasoners informed Large Language Model for Multi-Agent Path Finding
2508.17971v1
cs.AI, cs.RO
2025-08-27
Авторы:
Pu Feng, Size Wang, Yuhong Cao, Junkang Liang, Rongye Shi, Wenjun Wu
Резюме на русском
## Контекст
Multi-agent path finding (MAPF) является относительно недавно исследуемой областью в искусственном интеллекте, которая заключается в управлении несколькими агентами, чтобы они могли перемещаться по карте, избегая коллизий. Эту задачу можно применять в различных сценариях, включая робототехнику, игры с несколькими участниками и управление транспортом. Несмотря на то, что обычные традиционные методы, такие как A* или динамическое программирование, работают достаточно хорошо для MAPF, они часто имеют ограничения в обработке больших данных или сложных сценариев. Однако недавнее развитие больших моделей языка (LLM) позволило использовать их для решения широкого спектра задач, включая MAPF. Однако существуют недостатки в способности LLM решать MAPF, что делает необходимым развитие новых подходов для улучшения их эффективности в таких задачах.
## Метод
Мы предлагаем **LLM-NAR (Large Language Model with Neural Algorithmic Reasoner)** — новую архитектуру, которая использует LLM в качестве основы и включает модель графов с нейронными алгоритмическими моделями (NAR) для улучшения производительности в задачах MAPF. Данная модель состоит из трех элементов: **LLM для MAPF**, которая предоставляет базовую модель для обработки языка, **предварительно обученной модели графов с GNN** (Graph Neural Network), которая обрабатывает карту и данные по маршрутам, и **кросс-аттенционной механизмом**, которая помогает LLM и NAR взаимодействовать. Это взаимодействие позволяет LLM использовать графы и карты для более точного планирования. Мы также внедрили адаптивную стратегию обучения, позволяющую LLM-NAR становиться более эффективной при решении сложных задач MAPF.
## Результаты
Мы провели ряд экспериментов для оценки эффективности LLM-NAR. Для этого мы использовали две различные среды: симуляционную и реальную, для проверки возможности модели. Мы сравнили LLM-NAR с другими существующими подходами, в том числе с LLM-only моделями и традиционными MAPF-методами. Отчеты показали, что LLM-NAR не только существенно улучшает производительность в сравнении с LLM-only моделями, но и превосходит традиционные MAPF-методы в сложных задачах. В симуляционных и реальных экспериментах LLM-NAR показал высокую точность и эффективность в решении задач, что демонстрирует его высокую применимость в различных сценариях.
## Значимость
LLM-NAR может быть применено в различных областях, включая робототехнику, системы управления транспортом и игровые системы. Одним из основных преимуществ является улучшение производительности в задачах MAPF за счет интеграции LLM с нейронными моделями, что позволяет обрабатывать более сложные сценарии. Кроме того, L
Abstract
The development and application of large language models (LLM) have
demonstrated that foundational models can be utilized to solve a wide array of
tasks. However, their performance in multi-agent path finding (MAPF) tasks has
been less than satisfactory, with only a few studies exploring this area. MAPF
is a complex problem requiring both planning and multi-agent coordination. To
improve the performance of LLM in MAPF tasks, we propose a novel framework,
LLM-NAR, which leverages neural algorithmic reasoners (NAR) to inform LLM for
MAPF. LLM-NAR consists of three key components: an LLM for MAPF, a pre-trained
graph neural network-based NAR, and a cross-attention mechanism. This is the
first work to propose using a neural algorithmic reasoner to integrate GNNs
with the map information for MAPF, thereby guiding LLM to achieve superior
performance. LLM-NAR can be easily adapted to various LLM models. Both
simulation and real-world experiments demonstrate that our method significantly
outperforms existing LLM-based approaches in solving MAPF problems.
Ссылки и действия
Дополнительные ресурсы: