Grounding Natural Language for Multi-agent Decision-Making with Multi-agentic LLMs

2508.07466v1 cs.AI 2025-08-13
Авторы:

Dom Huh, Prasant Mohapatra

Резюме на русском

## Контекст Язык является основным средством сотрудничества и решения задач, встречающихся как в повседневных интеракциях, так и в сложных задачах решения проблем. Однако в многоагентных системах, где несколько субъектов должны совместно принимать решения, общаться и стратегизировать, установление четкого и эффективного общения является ключевым фактором успеха. Недостаточное понимание или несовпадение языковых моделей между агентами может привести к затруднениям в сотрудничестве и принятии решений. Данная работа рассматривает область многоагентного решения задач с использованием многоязыковых глубинных сетей (LLMs), сфокусировавшись на исследовании методов гарантированного языкового синхронизации и оптимальных стратегий решения для улучшения командных решений. ## Метод Систематический подход к разработке многоагентных LLM включает в себя несколько перспективных технических решений. Алгоритмы расширенной формулировки запросов (prompt engineering) используются для точного выражения потребностей и стратегий каждого агента. Многомодальная обработка данных позволяет агентам обрабатывать текстовую информацию, изображения и другие формы мультимедиа в едином контексте. Архитектура памяти была разработана для эффективной хранения и доступа к предыдущим решениям и сообщениям. Финейзированные методы тренировки (fine-tuning) использовались для настройки модели на совместное решение задач, учитывая социальные дилеммы и теорию игр. Эти компоненты объединены в программное обеспечение, которое обеспечивает гармоничное сотрудничество между агентами. ## Результаты В экспериментах были рассмотрены классические игровые ситуации, включающие социальные дилеммы, такие как дилемма уточек и игру в кооперацию. Данные для экспериментов были подготовлены с применением многоагентных сценариев, где каждый агент отвечал за свой набор задач и стратегий. Результаты показали, что использование развитых техник LLM приводит к значительному повышению точности и эффективности решений. Абляционные исследования подтвердили значимость каждого компонента системы, в том числе продвинутой формулировки запросов, многомодального обработки данных и многоагентной настройки. ## Значимость Предложенная модель может быть применена в различных сферах, включая управление роботами, системы управления транспортом, интеллектуальные системы поддержки принятия решений и игровые системы. Основные преимущества заключаются в улучшении качества стратегического решения, эффективном взаимодействии между агентами и увеличении общей эффективности системы. П

Abstract

Language is a ubiquitous tool that is foundational to reasoning and collaboration, ranging from everyday interactions to sophisticated problem-solving tasks. The establishment of a common language can serve as a powerful asset in ensuring clear communication and understanding amongst agents, facilitating desired coordination and strategies. In this work, we extend the capabilities of large language models (LLMs) by integrating them with advancements in multi-agent decision-making algorithms. We propose a systematic framework for the design of multi-agentic large language models (LLMs), focusing on key integration practices. These include advanced prompt engineering techniques, the development of effective memory architectures, multi-modal information processing, and alignment strategies through fine-tuning algorithms. We evaluate these design choices through extensive ablation studies on classic game settings with significant underlying social dilemmas and game-theoretic considerations.

Ссылки и действия