MPCG: Multi-Round Persona-Conditioned Generation for Modeling the Evolution of Misinformation with LLMs
2509.16564v1
cs.CL, cs.SI
2025-09-24
Авторы:
Jun Rong Brian Chong, Yixuan Tang, Anthony K. H. Tung
Резюме на русском
#### Контекст
Моделирование распространения и эволюции мифиформ (misinformation) является сложной задачей, которую сложно выполнить с помощью статических моделей. Текущие подходы к оценке мифиформ основываются на предположении, что мифиформы неизменны. Однако на самом деле они часто изменяются в ходе распространения, адаптируясь к новым аудиториям. Эти изменения могут включать изменения языка, формулировок, моральных аспектов и перспектив. Наша работа сфокусирована на создании модели, которая будет эмулировать этот процесс эволюции мифиформ. Именно этой проблеме мы посвятили нашу исследовательскую работу.
#### Метод
Мы предлагаем Multi-Round Persona-Conditioned Generation (MPCG) — метод, который имитирует эволюцию мифиформ с помощью нескольких итераций. Мы используем неуправляемую модель языка (LLM), чтобы сгенерировать тексты, которые были бы адаптированы под разные персонажи в каждой итерации. Для этого мы используем выход от предыдущих итераций, чтобы усложнить итоговый результат. Мы также применяем метрики для оценки того, насколько хорошо модель справляется с этим задачей на практике. Это включает в себя не только читабельность и семантическую связность, но и метрики эмоциональной и моральной окраски текста.
#### Результаты
Мы провели подробные эксперименты, используя широкий спектр данных. Мы оценивали нашу модель с помощью различных задач: от анализа читабельности и понимаемости до оценки эмоциональных и моральных аспектов текстов. Наши результаты демонстрируют, что модель MPCG способна эффективно эмулировать эволюцию мифиформ, сохраняя семантическую связность между итерациями. Мы также исследовали возможность использования наших генерируемых данных в задачах классификации и оценки мифиформ.
#### Значимость
Модель MPCG может быть применена в различных областях, в том числе для моделирования эволюции мифиформ, анализа распространения информации, и для повышения точности моделей классификации. Одним из главных преимуществ этого подхода является то, что он позволяет исследовать не только содержание мифиформ, но и их ментальный эффект на различные группы пользователей. Мы также показали, что наш подход может сделать модели классификации мифиформ более устойчивыми к изменениям в тексте.
#### Выводы
Мы представили MPCG — модель, которая эмулирует эволюцию мифиформ с помощью нескольких итераций. Наши результаты показывают, что модель эффективно работает в задачах, связанных с моделированием и анализом мифиформ. Мы также выявили необходимость дальнейшего исследования в области моделирования эмоционального
Abstract
Misinformation evolves as it spreads, shifting in language, framing, and
moral emphasis to adapt to new audiences. However, current misinformation
detection approaches implicitly assume that misinformation is static. We
introduce MPCG, a multi-round, persona-conditioned framework that simulates how
claims are iteratively reinterpreted by agents with distinct ideological
perspectives. Our approach uses an uncensored large language model (LLM) to
generate persona-specific claims across multiple rounds, conditioning each
generation on outputs from the previous round, enabling the study of
misinformation evolution. We evaluate the generated claims through human and
LLM-based annotations, cognitive effort metrics (readability, perplexity),
emotion evocation metrics (sentiment analysis, morality), clustering,
feasibility, and downstream classification. Results show strong agreement
between human and GPT-4o-mini annotations, with higher divergence in fluency
judgments. Generated claims require greater cognitive effort than the original
claims and consistently reflect persona-aligned emotional and moral framing.
Clustering and cosine similarity analyses confirm semantic drift across rounds
while preserving topical coherence. Feasibility results show a 77% feasibility
rate, confirming suitability for downstream tasks. Classification results
reveal that commonly used misinformation detectors experience macro-F1
performance drops of up to 49.7%. The code is available at
https://github.com/bcjr1997/MPCG
Ссылки и действия
Дополнительные ресурсы: