Implicit Behavioral Alignment of Language Agents in High-Stakes Crowd Simulations

2509.16457v1 cs.CL, cs.AI, cs.CY 2025-09-24

Авторы:

Yunzhe Wang, Gale M. Lucas, Burcin Becerik-Gerber, Volkan Ustun

Резюме на русском

## Контекст Появление языковоориентированных генерирующих агентов сильно изменило возможности социальных симуляций в широких областях, от обучения интерперсональных навыков до формирования политических решений. Однако в этих симуляциях часто наблюдается отклонение поведения генерирующих агентов от реальных данных и ожиданий экспертов. Это проблема, известная как **Behavior-Realism Gap**, становится важной темой для исследований, так как несоответствие между агентским поведением и реальностью может привести к ошибочным выводам и неэффективным решениям в критически важных ситуациях. Наша мотивация заключается в создании методологии, которая улучшит реализм и надежность поведения генерирующих агентов в критически важных ситуациях. ## Метод Для решения проблемы Behavior-Realism Gap мы представляем **Persona-Environment Behavioral Alignment (PEBA)** — новую теоретическую модель, которая визуализирует поведение как функцию личности и окружения. PEBA формулируется как задача соответствия распределений, что позволяет адаптировать поведение генерирующих агентов к реальным данным. Для реализации мы предлагаем **PersonaEvolve (PEvo)**, алгоритм на основе Large Language Models (LLM), который итеративно оптимизирует субъективные характеристики агентов, чтобы добиться более реалистичного поведения. Основные элементы PEvo включают: - **Принцип адаптации**: итеративное уточнение личностных характеристик для достижения соответствия распределению реальности. - **Окружение как фактор**: интеграция контекста окружения для более естественного поведения. - **Оптимизация динамических сценариев**: адаптация поведения к изменению условий симуляции. ## Результаты Мы проверили PEvo в симуляции активного штурма с помощью специально разработанной среды. Эксперименты показали следующие результаты: - **Снижение распределенного отклонения**: PEvo достиг 84% среднего снижения распределенного отклонения по сравнению с ситуацией без управления поведением. - **Превосходство перед базовыми методами**: PEvo показал 34% лучшую реалистичность по сравнению с алгоритмами, основанными на эксплицитных инструкциях. - **Устойчивость и гибкость**: рефинированные личности агентов показали высокую общим поведением в новых, схожих ситуациях. Эти результаты доказывают, что PEvo не только улучшает реализм поведения, но и делает его более надежным в критически важных ситуациях. ## Значимость Предложенный подход может быть применен в следующих областях: - **Обучение интерперсональных навыков**: где реалистичное поведение генерирующих агентов является ключевым для эффективности. - **Политическое решающее процесс**: где реа

Abstract

Language-driven generative agents have enabled large-scale social simulations with transformative uses, from interpersonal training to aiding global policy-making. However, recent studies indicate that generative agent behaviors often deviate from expert expectations and real-world data--a phenomenon we term the Behavior-Realism Gap. To address this, we introduce a theoretical framework called Persona-Environment Behavioral Alignment (PEBA), formulated as a distribution matching problem grounded in Lewin's behavior equation stating that behavior is a function of the person and their environment. Leveraging PEBA, we propose PersonaEvolve (PEvo), an LLM-based optimization algorithm that iteratively refines agent personas, implicitly aligning their collective behaviors with realistic expert benchmarks within a specified environmental context. We validate PEvo in an active shooter incident simulation we developed, achieving an 84% average reduction in distributional divergence compared to no steering and a 34% improvement over explicit instruction baselines. Results also show PEvo-refined personas generalize to novel, related simulation scenarios. Our method greatly enhances behavioral realism and reliability in high-stakes social simulations. More broadly, the PEBA-PEvo framework provides a principled approach to developing trustworthy LLM-driven social simulations.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Implicit Behavioral Alignment of Language Agents in High-Stakes Crowd Simulations

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

No Free Lunch in Language Model Bias Mitigation? Targeted Bias Reduction Can Exa...

Reinforcing Stereotypes of Anger: Emotion AI on African American Vernacular Engl...

Moral Susceptibility and Robustness under Persona Role-Play in Large Language Mo...

LocalBench: Benchmarking LLMs on County-Level Local Knowledge and Reasoning

AI Diffusion in Low Resource Language Countries

Навигация