Strategic Tradeoffs Between Humans and AI in Multi-Agent Bargaining
2509.09071v2
cs.AI, cs.GT, cs.HC
2025-09-16
Авторы:
Crystal Qian, Kehang Zhu, John Horton, Benjamin S. Manning, Vivian Tsai, James Wexler, Nithum Thain
Резюме на русском
## Контекст
За последние годы возникла ситуация, когда во многих сферах жизнедеятельности задачи, которые раньше выполнялись людьми, теперь передаются автоматизированным агентам. Это направление особенно актуально в условиях развития искусственного интеллекта, когда роль роботов и автоматизированных систем становится все более значительной. Однако необходимо не только оценить их работу, но и изучить, как эти агенты обмениваются информацией и принимают решения в процессе взаимодействия. Эта проблема актуальна, так как разные агенты обладают разными преимуществами. Например, статистические агенты, такие как модели Байеса, могут очень эффективно работать в условиях, где окружающая среда хорошо определена и стабильна. Зато большие языковые модели (LLMs), такие как GPT-4 или Gemini 1.5 Pro, показывают свои преимущества в более широком контексте и способности к гибкой адаптации. В данной работе мы сравниваем работу людей, LLMs и статистических агентов в динамической среде, где им предлагается выполнить совместные задачи, которые требуют стратегического подхода и гибкости в поведении.
## Метод
Мы проводили эксперименты, в которых участвуют люди (216 участников), статистические агенты, основанные на Байесовских моделях, и модели БООМ, такие как GPT-4 и Gemini 1.5 Pro. Участники должны были выполнять таск, в котором они должны были принимать решения в динамической и непредсказуемой ситуации, когда действия одного участника могут влиять на результаты других. Мы сравнивали не только результаты (то есть, сколько каждый участник получил в итоге), но и способы принятия решений, стратегии, работающие в этой ситуации. Эксперимент был проведен в условиях, когда все участники имели одинаковые инструменты и возможности, что позволило сделать компаративные выводы.
## Результаты
В результатах мы обнаружили, что у каждого из участников были свои специфические стратегии. Байесовские агенты, оптимизируя безукоризненную логику, получили наибольшую суммарную сумму, но при этом их поведение было достаточно жестким. Они часто отклоняли предложения, что приводило к провалам в сотрудничестве. Люди и LLMs, в свою очередь, показали более сбалансированное поведение. Люди старались добиться справедливости, что приводило к более высокой сумме общего блага, но при этом их решения часто были более рискованными. LLMs, в свою очередь, старались сохранять консервативность, что привело к меньшему количеству отклонений, но при этом их результаты в суммарном плане не так высоки, как у людей. Таким образом, мы можем отметить, что каж
Abstract
Coordination tasks traditionally performed by humans are increasingly being
delegated to autonomous agents. As this pattern progresses, it becomes critical
to evaluate not only these agents' performance but also the processes through
which they negotiate in dynamic, multi-agent environments. Furthermore,
different agents exhibit distinct advantages: traditional statistical agents,
such as Bayesian models, may excel under well-specified conditions, whereas
large language models (LLMs) can generalize across contexts. In this work, we
compare humans (N = 216), LLMs (GPT-4o, Gemini 1.5 Pro), and Bayesian agents in
a dynamic negotiation setting that enables direct, identical-condition
comparisons across populations, capturing both outcomes and behavioral
dynamics. Bayesian agents extract the highest surplus through aggressive
optimization, at the cost of frequent trade rejections. Humans and LLMs can
achieve similar overall surplus, but through distinct behaviors: LLMs favor
conservative, concessionary trades with few rejections, while humans employ
more strategic, risk-taking, and fairness-oriented behaviors. Thus, we find
that performance parity -- a common benchmark in agent evaluation -- can
conceal fundamental differences in process and alignment, which are critical
for practical deployment in real-world coordination tasks.
Ссылки и действия
Дополнительные ресурсы: