Towards Strategic Persuasion with Language Models

2509.22989v1 cs.AI, cs.CY, cs.GT 2025-10-01

Авторы:

Zirui Cheng, Jiaxuan You

Резюме на русском

Описание работы ================= ## Контекст Large language models (LLMs) становятся все более важными в области стратегического взаимодействия, в частности в области подтолкивания и конверсий. Эти модели показали способность сопоставиться с уровнем человеческой способности к убеждению. Однако существуют серьезные проблемы, связанные с измерением их эффективности в различных сферах. Многие попытки оценки эффективности LLMs основываются на неконтролируемых методах, что приводит к непоследовательности и неточности. В настоящей работе рассматривается новый подход к измерению эффективности LLMs, используя теоретический фреймворк Bayesian Persuasion (BP). Этот подход позволяет определить и измерить качество убеждения посредством стратегического взаимодействия, построенного на заранее определенных данных. ## Метод В этой работе предлагается фреймворк, основанный на теории Bayesian Persuasion, для измерения эффективности LLMs в стратегическом убеждении. Методология заключается в повторном использовании существующих наборов данных, полученных в условиях человеческого-человеческого взаимодействия. Эти данные преобразуются в среду, которая позволяет измерять точность убеждения LLMs. Основной инновацией является возможность адаптировать LLMs к различным стратегическим задачам с помощью теории BP. Фреймворк также включает в себя методы реинтеграции и оценки, которые позволяют измерять достигнутую эффективность. ## Результаты Исследования показали, что передовые модели LLMs достигают высоких результатов в убеждении, согласно теоретическим прогнозам. Было продемонстрировано, что граничные модели LLMs могут постоянно охватывать более высокие значения убеждения. Были выявлены сложные стратегии убеждения, которые работают даже в условиях малого количества данных. Также был проведен эксперимент с использованием reinforcement learning для обучения LLMs к стратегическому убеждению. Наблюдалось, что даже небольшие модели LLMs могут быть значительно улучшены при помощи reinforcement learning, достигая высоких результатов в стратегическом убеждении. ## Значимость Этот подход может быть применен в различных сферах, включая маркетинг, право, образование и медицину. Он может помочь улучшить узнаваемость и эффективность убеждения в стратегических задачах. Основные преимущества включают точную оценку качества убеждения, универсальность фреймворка и возможность применения к различным областям. В будущем могут быть рассмотрены расширения фреймворка для учета более сложных сред и улучшения методов интерпретирования результатов. ## Выводы В настоящей работе был предложен новый фреймворк для измер

Abstract

Large language models (LLMs) have demonstrated strong persuasive capabilities comparable to those of humans, offering promising benefits while raising societal concerns about their deployment. However, systematically evaluating the persuasive capabilities of LLMs is inherently challenging, as the effectiveness of persuasion among humans varies significantly across different domains. In this paper, we take a theory-driven approach to provide a scalable and principled framework for measuring the persuasive capabilities of LLMs. Grounded in the Bayesian Persuasion (BP) framework, we repurpose existing human-human persuasion datasets to construct environments for evaluating and training LLMs in strategic persuasion. Our results reveal that frontier models can consistently achieve high persuasion gains and exhibit sophisticated persuasion strategies that align with theoretical predictions. Building on this, we use reinforcement learning to train LLMs for strategic persuasion in our environments. Our results also demonstrate that even small LLMs can obtain significantly higher persuasion gains through reinforcement learning.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Резюме на русском

Abstract

Ссылки и действия

Навигация