Evaluating Behavioral Alignment in Conflict Dialogue: A Multi-Dimensional Comparison of LLM Agents and Humans

2509.16394v1 cs.CL, cs.AI, cs.HC 2025-09-24
Авторы:

Deuksin Kwon, Kaleen Shrestha, Bin Han, Elena Hayoung Lee, Gale Lucas

Резюме на русском

## Контекст Современные Large Language Models (LLMs) востребованы в различных сценариях взаимодействия, включая социально-интерактивные задачи, требующие стратегического мышления и эмоциональной уравновешенности. Однако их возможности в этих областях остаются недостаточно исследованы. Это связано с тем, что LLMs часто не успешно моделируют человеческое поведение в социально-стратегических ситуациях, таких как конфликтные диалоги. Недостаток безупречного подражания человеческим образцам в этих областях снижает доверие к их применению в реальной жизни. Ранее проведенные исследования показали, что LLMs могут некорректно реагировать на эмоциональные воздействия или отождествляться с некритичными стратегическими подходами. Данное исследование фокусируется на оценке уровня биBEHAVIORAL ALIGNMENT IN CONFLICT DIALOGUEBEHAVIORAL ALIGNMENT IN CONFLICT DIALOGUEЬничности LLMs в таких диалогах. ## Метод Для эмуляции конфликтных диалогов был применен подход с использованием специально настроенных LLM-агентов. Для каждого агента была выбрана стратегия, основанная на пятифакторной модели личности, чтобы эмулировать характеристики персонажа. Эта подходка позволила ограничить исследовательский вопрос, давая наглядный контроль над взаимодействием. Затем, во время диалогов, LLMs предсказывали свои выводы, используя систему мотивации, схожую с человеческими мотивами. Использовались три основные критерия для оценки: лингвистический стиль, эмоциональное выражение (например, динамика ярости) и стратегическое поведение. Для экспериментов взяли две модели LLM: GPT-4.1 и Claude-3.7-Sonnet. ## Результаты В ходе эксперимента GPT-4.1 показала наибольшую схожесть с поведением человека в лингвистическом стиле и эмоциональном выражении. Claude-3.7-Sonnet, в свою очередь, демонстрировала более высокий уровень стратегического совпадения. Однако, несмотря на достижения, были выявлены значительные различия в поведении LLMs по сравнению с поведением человека, особенно в сфере стратегического взаимодействия. В целом, GPT-4.1 демонстрировала более высокий уровень соответствия человеческому поведению, но не всегда удавалось обеспечить согласованность во взаимодействии. ## Значимость Выявленные результаты могут быть применены в различных областях, включая обучение системам коммуникации, создание улучшенных моделей взаимодействия, и научно-исследовательские исследования в области гуманитарных технологий. Лидерство GPT-4.1 в лингвистическом стиле и эмоциональном выражении открывает путь к её использованию в разработке более реалистичных моделей взаимодействия. Это также по

Abstract

Large Language Models (LLMs) are increasingly deployed in socially complex, interaction-driven tasks, yet their ability to mirror human behavior in emotionally and strategically complex contexts remains underexplored. This study assesses the behavioral alignment of personality-prompted LLMs in adversarial dispute resolution by simulating multi-turn conflict dialogues that incorporate negotiation. Each LLM is guided by a matched Five-Factor personality profile to control for individual variation and enhance realism. We evaluate alignment across three dimensions: linguistic style, emotional expression (e.g., anger dynamics), and strategic behavior. GPT-4.1 achieves the closest alignment with humans in linguistic style and emotional dynamics, while Claude-3.7-Sonnet best reflects strategic behavior. Nonetheless, substantial alignment gaps persist. Our findings establish a benchmark for alignment between LLMs and humans in socially complex interactions, underscoring both the promise and the limitations of personality conditioning in dialogue modeling.

Ссылки и действия