Engineered over Emergent Communication in MARL for Scalable and Sample-Efficient Cooperative Task Allocation in a Partially Observable Grid
2508.02912v1
cs.MA, cs.AI, cs.LG, cs.SY, eess.SY, 68T42, 68T05, 90C40, 93E35, 68T07, I.2.11; I.2.6; I.2.8
2025-08-09
Авторы:
Brennen A. Hill, Mant Koh En Wei, Thangavel Jishnuanandh
Резюме на русском
**Резюме**
В данной работе рассматривается сравнение инженерного подхода к коммуникации (Engineered Communication) с инструментом под названием Learned Direct Communication (LDC) в рамках кооперативной многоагентной оркестрации задач в частично наблюдаемых средах. Инженерный подход включает в себя модель Imagined Trajectory Generation Module (ITGM) и Message Generation Network (MGN), которые формируют сообщения на основе прогнозированных будущих состояний. Исследование проводилось на задачах с различным уровнем сложности и видов наблюдаемости. Основным выводом является то, что инженерный подход демонстрирует более высокую эффективность и масштабируемость по сравнению с инструментом LDC. Это открытие показывает, что дизайн коммуникационных стратегий может опередить подходы, основанные на научном исследовании, в сложных, многоагентных средах.
Abstract
We compare the efficacy of learned versus engineered communication strategies
in a cooperative multi-agent reinforcement learning (MARL) environment. For the
learned approach, we introduce Learned Direct Communication (LDC), where agents
generate messages and actions concurrently via a neural network. Our engineered
approach, Intention Communication, employs an Imagined Trajectory Generation
Module (ITGM) and a Message Generation Network (MGN) to formulate messages
based on predicted future states. Both strategies are evaluated on their
success rates in cooperative tasks under fully and partially observable
conditions. Our findings indicate that while emergent communication is viable,
the engineered approach demonstrates superior performance and scalability,
particularly as environmental complexity increases.