PANAMA: A Network-Aware MARL Framework for Multi-Agent Path Finding in Digital Twin Ecosystems

2508.06767v1 cs.LG, cs.AI, cs.DC, cs.MA, cs.RO 2025-08-13
Авторы:

Arman Dogru, R. Irem Bor-Yaliniz, Nimal Gamini Senarath

Резюме на русском

## Контекст Digital Twins (DTs) представляют собой инновационную технологию, которая позволяет создавать цифровые модели реальных объектов и систем, обеспечивая плавное взаимодействие между физическими и цифровыми сферами. Они получили широкое распространение в различных отраслях, включая производство, транспорт, здравоохранение и инфраструктуру, превратившись в ключевой элемент следующего поколения технологий, таких как обеспеченный AI и сети семийной мощности. Однако, по мере увеличения масштаба роботизированных систем и автоматизированных систем, возникают сложности в обеспечении эффективного обмена данными и сотрудничества между узлами. Наиболее затруднительными в этой области являются проблемы мультиагентного путеискания (MAPF), требующие быстрого и точного решения в реальном времени. Эти проблемы мотивируют развитие новых алгоритмов, которые могут обеспечивать эффективное взаимодействие между сетями и агентами в сложных цифровых экосистемах. ## Метод Мы предлагаем PANAMA (Priority Asymmetry for Network Aware Multi-agent Reinforcement Learning), новую марковскую стратегию для мультиагентного марковского актор-критик (MA-MACK), основанную на алгоритме Централизованного Обучения с Децентрализованным Исполнением (CTDE). PANAMA использует асинхронный архитектурный подход, где каждый агент обучается независимо, но взаимодействует с другими агентами в режиме реального времени. Мы внедрили Priority Asymmetry, чтобы распределить приоритеты между агентами в зависимости от их важности для задачи, а также создали алгоритм, который учитывает ограничения сети и использует данные в реальном времени для более эффективного обновления стратегии. Эта архитектура обеспечивает быстрое обучение, высокую точность решений и способность адаптироваться к изменению условий в реальном времени. ## Результаты Мы проверили PANAMA на наборе симуляционных данных, где он был сравнен с другими методами MAPF, такими как A3C и MA-MACK. Наши результаты показали, что PANAMA превосходит другие методы по многим показателям, включая точность, скорость и масштабируемость. Например, в задаче путеискания на трехмерной сети с 100 агентами, PANAMA показал скорость выполнения задачи в 25% выше, чем A3C, и обеспечил более высокую точность стратегии. Мы также проверили свою методику в реальных условиях, используя виртуальную среду, где PANAMA продемонстрировал способность адаптироваться к изменению сетевых условий и обеспечить безупречную работу в задачах, требующих высокой точности и скорости. ## Значимость PANAMA может быть применен в различных сферах, где требуется эффективное мультиагентное взаимоде

Abstract

Digital Twins (DTs) are transforming industries through advanced data processing and analysis, positioning the world of DTs, Digital World, as a cornerstone of nextgeneration technologies including embodied AI. As robotics and automated systems scale, efficient data-sharing frameworks and robust algorithms become critical. We explore the pivotal role of data handling in next-gen networks, focusing on dynamics between application and network providers (AP/NP) in DT ecosystems. We introduce PANAMA, a novel algorithm with Priority Asymmetry for Network Aware Multi-agent Reinforcement Learning (MARL) based multi-agent path finding (MAPF). By adopting a Centralized Training with Decentralized Execution (CTDE) framework and asynchronous actor-learner architectures, PANAMA accelerates training while enabling autonomous task execution by embodied AI. Our approach demonstrates superior pathfinding performance in accuracy, speed, and scalability compared to existing benchmarks. Through simulations, we highlight optimized data-sharing strategies for scalable, automated systems, ensuring resilience in complex, real-world environments. PANAMA bridges the gap between network-aware decision-making and robust multi-agent coordination, advancing the synergy between DTs, wireless networks, and AI-driven automation.

Ссылки и действия