Evaluating Behavioral Alignment in Conflict Dialogue: A Multi-Dimensional Comparison of LLM Agents and Humans
2509.16394v1
cs.CL, cs.AI, cs.HC
2025-09-24
Авторы:
Deuksin Kwon, Kaleen Shrestha, Bin Han, Elena Hayoung Lee, Gale Lucas
Резюме на русском
## Контекст
Современные Large Language Models (LLMs) востребованы в различных сценариях взаимодействия, включая социально-интерактивные задачи, требующие стратегического мышления и эмоциональной уравновешенности. Однако их возможности в этих областях остаются недостаточно исследованы. Это связано с тем, что LLMs часто не успешно моделируют человеческое поведение в социально-стратегических ситуациях, таких как конфликтные диалоги. Недостаток безупречного подражания человеческим образцам в этих областях снижает доверие к их применению в реальной жизни. Ранее проведенные исследования показали, что LLMs могут некорректно реагировать на эмоциональные воздействия или отождествляться с некритичными стратегическими подходами. Данное исследование фокусируется на оценке уровня биBEHAVIORAL ALIGNMENT IN CONFLICT DIALOGUEBEHAVIORAL ALIGNMENT IN CONFLICT DIALOGUEЬничности LLMs в таких диалогах.
## Метод
Для эмуляции конфликтных диалогов был применен подход с использованием специально настроенных LLM-агентов. Для каждого агента была выбрана стратегия, основанная на пятифакторной модели личности, чтобы эмулировать характеристики персонажа. Эта подходка позволила ограничить исследовательский вопрос, давая наглядный контроль над взаимодействием. Затем, во время диалогов, LLMs предсказывали свои выводы, используя систему мотивации, схожую с человеческими мотивами. Использовались три основные критерия для оценки: лингвистический стиль, эмоциональное выражение (например, динамика ярости) и стратегическое поведение. Для экспериментов взяли две модели LLM: GPT-4.1 и Claude-3.7-Sonnet.
## Результаты
В ходе эксперимента GPT-4.1 показала наибольшую схожесть с поведением человека в лингвистическом стиле и эмоциональном выражении. Claude-3.7-Sonnet, в свою очередь, демонстрировала более высокий уровень стратегического совпадения. Однако, несмотря на достижения, были выявлены значительные различия в поведении LLMs по сравнению с поведением человека, особенно в сфере стратегического взаимодействия. В целом, GPT-4.1 демонстрировала более высокий уровень соответствия человеческому поведению, но не всегда удавалось обеспечить согласованность во взаимодействии.
## Значимость
Выявленные результаты могут быть применены в различных областях, включая обучение системам коммуникации, создание улучшенных моделей взаимодействия, и научно-исследовательские исследования в области гуманитарных технологий. Лидерство GPT-4.1 в лингвистическом стиле и эмоциональном выражении открывает путь к её использованию в разработке более реалистичных моделей взаимодействия. Это также по
Abstract
Large Language Models (LLMs) are increasingly deployed in socially complex,
interaction-driven tasks, yet their ability to mirror human behavior in
emotionally and strategically complex contexts remains underexplored. This
study assesses the behavioral alignment of personality-prompted LLMs in
adversarial dispute resolution by simulating multi-turn conflict dialogues that
incorporate negotiation. Each LLM is guided by a matched Five-Factor
personality profile to control for individual variation and enhance realism. We
evaluate alignment across three dimensions: linguistic style, emotional
expression (e.g., anger dynamics), and strategic behavior. GPT-4.1 achieves the
closest alignment with humans in linguistic style and emotional dynamics, while
Claude-3.7-Sonnet best reflects strategic behavior. Nonetheless, substantial
alignment gaps persist. Our findings establish a benchmark for alignment
between LLMs and humans in socially complex interactions, underscoring both the
promise and the limitations of personality conditioning in dialogue modeling.
Ссылки и действия
Дополнительные ресурсы: