Grounding Natural Language for Multi-agent Decision-Making with Multi-agentic LLMs
2508.07466v1
cs.AI
2025-08-13
Авторы:
Dom Huh, Prasant Mohapatra
Резюме на русском
## Контекст
Язык является основным средством сотрудничества и решения задач, встречающихся как в повседневных интеракциях, так и в сложных задачах решения проблем. Однако в многоагентных системах, где несколько субъектов должны совместно принимать решения, общаться и стратегизировать, установление четкого и эффективного общения является ключевым фактором успеха. Недостаточное понимание или несовпадение языковых моделей между агентами может привести к затруднениям в сотрудничестве и принятии решений. Данная работа рассматривает область многоагентного решения задач с использованием многоязыковых глубинных сетей (LLMs), сфокусировавшись на исследовании методов гарантированного языкового синхронизации и оптимальных стратегий решения для улучшения командных решений.
## Метод
Систематический подход к разработке многоагентных LLM включает в себя несколько перспективных технических решений. Алгоритмы расширенной формулировки запросов (prompt engineering) используются для точного выражения потребностей и стратегий каждого агента. Многомодальная обработка данных позволяет агентам обрабатывать текстовую информацию, изображения и другие формы мультимедиа в едином контексте. Архитектура памяти была разработана для эффективной хранения и доступа к предыдущим решениям и сообщениям. Финейзированные методы тренировки (fine-tuning) использовались для настройки модели на совместное решение задач, учитывая социальные дилеммы и теорию игр. Эти компоненты объединены в программное обеспечение, которое обеспечивает гармоничное сотрудничество между агентами.
## Результаты
В экспериментах были рассмотрены классические игровые ситуации, включающие социальные дилеммы, такие как дилемма уточек и игру в кооперацию. Данные для экспериментов были подготовлены с применением многоагентных сценариев, где каждый агент отвечал за свой набор задач и стратегий. Результаты показали, что использование развитых техник LLM приводит к значительному повышению точности и эффективности решений. Абляционные исследования подтвердили значимость каждого компонента системы, в том числе продвинутой формулировки запросов, многомодального обработки данных и многоагентной настройки.
## Значимость
Предложенная модель может быть применена в различных сферах, включая управление роботами, системы управления транспортом, интеллектуальные системы поддержки принятия решений и игровые системы. Основные преимущества заключаются в улучшении качества стратегического решения, эффективном взаимодействии между агентами и увеличении общей эффективности системы. П
Abstract
Language is a ubiquitous tool that is foundational to reasoning and
collaboration, ranging from everyday interactions to sophisticated
problem-solving tasks. The establishment of a common language can serve as a
powerful asset in ensuring clear communication and understanding amongst
agents, facilitating desired coordination and strategies. In this work, we
extend the capabilities of large language models (LLMs) by integrating them
with advancements in multi-agent decision-making algorithms. We propose a
systematic framework for the design of multi-agentic large language models
(LLMs), focusing on key integration practices. These include advanced prompt
engineering techniques, the development of effective memory architectures,
multi-modal information processing, and alignment strategies through
fine-tuning algorithms. We evaluate these design choices through extensive
ablation studies on classic game settings with significant underlying social
dilemmas and game-theoretic considerations.
Ссылки и действия
Дополнительные ресурсы: