TransAM: Transformer-Based Agent Modeling for Multi-Agent Systems via Local Trajectory Encoding
2508.02826v1
cs.MA, cs.AI
2025-08-09
Авторы:
Conor Wallace, Umer Siddique, Yongcan Cao
Резюме на русском
Оптимальное агентское поведение в многоагентных системах зависит от точного понимания поведения других агентов. Однако в реальных приложениях часто недоступен полный доступ к истории действий других агентов, что ограничивает эффективность существующих подходов к их моделированию. В статье предлагается TransAM — новый подход, основанный на трансформерах, для моделирования агентов на основе локальных траекторий. Метод учится представлять поведение других агентов только на основе локальных данных управляемого агента. Оценка TransAM проводилась в различных многоагентных средах: кооперативных, конкурентных и смешанных. Результаты показали, что TransAM эффективно генерирует представления поведения других агентов, улучшает общую модель и повышает эпизодические вознаграждения. Этот подход может стать ключевым для решения проблемы моделирования агентов в условиях ограниченного доступа к их истории действий.
Abstract
Agent modeling is a critical component in developing effective policies
within multi-agent systems, as it enables agents to form beliefs about the
behaviors, intentions, and competencies of others. Many existing approaches
assume access to other agents' episodic trajectories, a condition often
unrealistic in real-world applications. Consequently, a practical agent
modeling approach must learn a robust representation of the policies of the
other agents based only on the local trajectory of the controlled agent. In
this paper, we propose \texttt{TransAM}, a novel transformer-based agent
modeling approach to encode local trajectories into an embedding space that
effectively captures the policies of other agents. We evaluate the performance
of the proposed method in cooperative, competitive, and mixed multi-agent
environments. Extensive experimental results demonstrate that our approach
generates strong policy representations, improves agent modeling, and leads to
higher episodic returns.
Ссылки и действия
Дополнительные ресурсы: