TransAM: Transformer-Based Agent Modeling for Multi-Agent Systems via Local Trajectory Encoding

2508.02826v1 cs.MA, cs.AI 2025-08-09
Авторы:

Conor Wallace, Umer Siddique, Yongcan Cao

Резюме на русском

Оптимальное агентское поведение в многоагентных системах зависит от точного понимания поведения других агентов. Однако в реальных приложениях часто недоступен полный доступ к истории действий других агентов, что ограничивает эффективность существующих подходов к их моделированию. В статье предлагается TransAM — новый подход, основанный на трансформерах, для моделирования агентов на основе локальных траекторий. Метод учится представлять поведение других агентов только на основе локальных данных управляемого агента. Оценка TransAM проводилась в различных многоагентных средах: кооперативных, конкурентных и смешанных. Результаты показали, что TransAM эффективно генерирует представления поведения других агентов, улучшает общую модель и повышает эпизодические вознаграждения. Этот подход может стать ключевым для решения проблемы моделирования агентов в условиях ограниченного доступа к их истории действий.

Abstract

Agent modeling is a critical component in developing effective policies within multi-agent systems, as it enables agents to form beliefs about the behaviors, intentions, and competencies of others. Many existing approaches assume access to other agents' episodic trajectories, a condition often unrealistic in real-world applications. Consequently, a practical agent modeling approach must learn a robust representation of the policies of the other agents based only on the local trajectory of the controlled agent. In this paper, we propose \texttt{TransAM}, a novel transformer-based agent modeling approach to encode local trajectories into an embedding space that effectively captures the policies of other agents. We evaluate the performance of the proposed method in cooperative, competitive, and mixed multi-agent environments. Extensive experimental results demonstrate that our approach generates strong policy representations, improves agent modeling, and leads to higher episodic returns.

Ссылки и действия