Towards Strategic Persuasion with Language Models
2509.22989v1
cs.AI, cs.CY, cs.GT
2025-10-01
Авторы:
Zirui Cheng, Jiaxuan You
Резюме на русском
Описание работы
=================
## Контекст
Large language models (LLMs) становятся все более важными в области стратегического взаимодействия, в частности в области подтолкивания и конверсий. Эти модели показали способность сопоставиться с уровнем человеческой способности к убеждению. Однако существуют серьезные проблемы, связанные с измерением их эффективности в различных сферах. Многие попытки оценки эффективности LLMs основываются на неконтролируемых методах, что приводит к непоследовательности и неточности. В настоящей работе рассматривается новый подход к измерению эффективности LLMs, используя теоретический фреймворк Bayesian Persuasion (BP). Этот подход позволяет определить и измерить качество убеждения посредством стратегического взаимодействия, построенного на заранее определенных данных.
## Метод
В этой работе предлагается фреймворк, основанный на теории Bayesian Persuasion, для измерения эффективности LLMs в стратегическом убеждении. Методология заключается в повторном использовании существующих наборов данных, полученных в условиях человеческого-человеческого взаимодействия. Эти данные преобразуются в среду, которая позволяет измерять точность убеждения LLMs. Основной инновацией является возможность адаптировать LLMs к различным стратегическим задачам с помощью теории BP. Фреймворк также включает в себя методы реинтеграции и оценки, которые позволяют измерять достигнутую эффективность.
## Результаты
Исследования показали, что передовые модели LLMs достигают высоких результатов в убеждении, согласно теоретическим прогнозам. Было продемонстрировано, что граничные модели LLMs могут постоянно охватывать более высокие значения убеждения. Были выявлены сложные стратегии убеждения, которые работают даже в условиях малого количества данных. Также был проведен эксперимент с использованием reinforcement learning для обучения LLMs к стратегическому убеждению. Наблюдалось, что даже небольшие модели LLMs могут быть значительно улучшены при помощи reinforcement learning, достигая высоких результатов в стратегическом убеждении.
## Значимость
Этот подход может быть применен в различных сферах, включая маркетинг, право, образование и медицину. Он может помочь улучшить узнаваемость и эффективность убеждения в стратегических задачах. Основные преимущества включают точную оценку качества убеждения, универсальность фреймворка и возможность применения к различным областям. В будущем могут быть рассмотрены расширения фреймворка для учета более сложных сред и улучшения методов интерпретирования результатов.
## Выводы
В настоящей работе был предложен новый фреймворк для измер
Abstract
Large language models (LLMs) have demonstrated strong persuasive capabilities
comparable to those of humans, offering promising benefits while raising
societal concerns about their deployment. However, systematically evaluating
the persuasive capabilities of LLMs is inherently challenging, as the
effectiveness of persuasion among humans varies significantly across different
domains. In this paper, we take a theory-driven approach to provide a scalable
and principled framework for measuring the persuasive capabilities of LLMs.
Grounded in the Bayesian Persuasion (BP) framework, we repurpose existing
human-human persuasion datasets to construct environments for evaluating and
training LLMs in strategic persuasion. Our results reveal that frontier models
can consistently achieve high persuasion gains and exhibit sophisticated
persuasion strategies that align with theoretical predictions. Building on
this, we use reinforcement learning to train LLMs for strategic persuasion in
our environments. Our results also demonstrate that even small LLMs can obtain
significantly higher persuasion gains through reinforcement learning.
Ссылки и действия
Дополнительные ресурсы: