Implicit Behavioral Alignment of Language Agents in High-Stakes Crowd Simulations
2509.16457v1
cs.CL, cs.AI, cs.CY
2025-09-24
Авторы:
Yunzhe Wang, Gale M. Lucas, Burcin Becerik-Gerber, Volkan Ustun
Резюме на русском
## Контекст
Появление языковоориентированных генерирующих агентов сильно изменило возможности социальных симуляций в широких областях, от обучения интерперсональных навыков до формирования политических решений. Однако в этих симуляциях часто наблюдается отклонение поведения генерирующих агентов от реальных данных и ожиданий экспертов. Это проблема, известная как **Behavior-Realism Gap**, становится важной темой для исследований, так как несоответствие между агентским поведением и реальностью может привести к ошибочным выводам и неэффективным решениям в критически важных ситуациях. Наша мотивация заключается в создании методологии, которая улучшит реализм и надежность поведения генерирующих агентов в критически важных ситуациях.
## Метод
Для решения проблемы Behavior-Realism Gap мы представляем **Persona-Environment Behavioral Alignment (PEBA)** — новую теоретическую модель, которая визуализирует поведение как функцию личности и окружения. PEBA формулируется как задача соответствия распределений, что позволяет адаптировать поведение генерирующих агентов к реальным данным. Для реализации мы предлагаем **PersonaEvolve (PEvo)**, алгоритм на основе Large Language Models (LLM), который итеративно оптимизирует субъективные характеристики агентов, чтобы добиться более реалистичного поведения. Основные элементы PEvo включают:
- **Принцип адаптации**: итеративное уточнение личностных характеристик для достижения соответствия распределению реальности.
- **Окружение как фактор**: интеграция контекста окружения для более естественного поведения.
- **Оптимизация динамических сценариев**: адаптация поведения к изменению условий симуляции.
## Результаты
Мы проверили PEvo в симуляции активного штурма с помощью специально разработанной среды. Эксперименты показали следующие результаты:
- **Снижение распределенного отклонения**: PEvo достиг 84% среднего снижения распределенного отклонения по сравнению с ситуацией без управления поведением.
- **Превосходство перед базовыми методами**: PEvo показал 34% лучшую реалистичность по сравнению с алгоритмами, основанными на эксплицитных инструкциях.
- **Устойчивость и гибкость**: рефинированные личности агентов показали высокую общим поведением в новых, схожих ситуациях.
Эти результаты доказывают, что PEvo не только улучшает реализм поведения, но и делает его более надежным в критически важных ситуациях.
## Значимость
Предложенный подход может быть применен в следующих областях:
- **Обучение интерперсональных навыков**: где реалистичное поведение генерирующих агентов является ключевым для эффективности.
- **Политическое решающее процесс**: где реа
Abstract
Language-driven generative agents have enabled large-scale social simulations
with transformative uses, from interpersonal training to aiding global
policy-making. However, recent studies indicate that generative agent behaviors
often deviate from expert expectations and real-world data--a phenomenon we
term the Behavior-Realism Gap. To address this, we introduce a theoretical
framework called Persona-Environment Behavioral Alignment (PEBA), formulated as
a distribution matching problem grounded in Lewin's behavior equation stating
that behavior is a function of the person and their environment. Leveraging
PEBA, we propose PersonaEvolve (PEvo), an LLM-based optimization algorithm that
iteratively refines agent personas, implicitly aligning their collective
behaviors with realistic expert benchmarks within a specified environmental
context. We validate PEvo in an active shooter incident simulation we
developed, achieving an 84% average reduction in distributional divergence
compared to no steering and a 34% improvement over explicit instruction
baselines. Results also show PEvo-refined personas generalize to novel, related
simulation scenarios. Our method greatly enhances behavioral realism and
reliability in high-stakes social simulations. More broadly, the PEBA-PEvo
framework provides a principled approach to developing trustworthy LLM-driven
social simulations.
Ссылки и действия
Дополнительные ресурсы: