MPCG: Multi-Round Persona-Conditioned Generation for Modeling the Evolution of Misinformation with LLMs

2509.16564v1 cs.CL, cs.SI 2025-09-24

Авторы:

Jun Rong Brian Chong, Yixuan Tang, Anthony K. H. Tung

Резюме на русском

#### Контекст Моделирование распространения и эволюции мифиформ (misinformation) является сложной задачей, которую сложно выполнить с помощью статических моделей. Текущие подходы к оценке мифиформ основываются на предположении, что мифиформы неизменны. Однако на самом деле они часто изменяются в ходе распространения, адаптируясь к новым аудиториям. Эти изменения могут включать изменения языка, формулировок, моральных аспектов и перспектив. Наша работа сфокусирована на создании модели, которая будет эмулировать этот процесс эволюции мифиформ. Именно этой проблеме мы посвятили нашу исследовательскую работу. #### Метод Мы предлагаем Multi-Round Persona-Conditioned Generation (MPCG) — метод, который имитирует эволюцию мифиформ с помощью нескольких итераций. Мы используем неуправляемую модель языка (LLM), чтобы сгенерировать тексты, которые были бы адаптированы под разные персонажи в каждой итерации. Для этого мы используем выход от предыдущих итераций, чтобы усложнить итоговый результат. Мы также применяем метрики для оценки того, насколько хорошо модель справляется с этим задачей на практике. Это включает в себя не только читабельность и семантическую связность, но и метрики эмоциональной и моральной окраски текста. #### Результаты Мы провели подробные эксперименты, используя широкий спектр данных. Мы оценивали нашу модель с помощью различных задач: от анализа читабельности и понимаемости до оценки эмоциональных и моральных аспектов текстов. Наши результаты демонстрируют, что модель MPCG способна эффективно эмулировать эволюцию мифиформ, сохраняя семантическую связность между итерациями. Мы также исследовали возможность использования наших генерируемых данных в задачах классификации и оценки мифиформ. #### Значимость Модель MPCG может быть применена в различных областях, в том числе для моделирования эволюции мифиформ, анализа распространения информации, и для повышения точности моделей классификации. Одним из главных преимуществ этого подхода является то, что он позволяет исследовать не только содержание мифиформ, но и их ментальный эффект на различные группы пользователей. Мы также показали, что наш подход может сделать модели классификации мифиформ более устойчивыми к изменениям в тексте. #### Выводы Мы представили MPCG — модель, которая эмулирует эволюцию мифиформ с помощью нескольких итераций. Наши результаты показывают, что модель эффективно работает в задачах, связанных с моделированием и анализом мифиформ. Мы также выявили необходимость дальнейшего исследования в области моделирования эмоционального

Abstract

Misinformation evolves as it spreads, shifting in language, framing, and moral emphasis to adapt to new audiences. However, current misinformation detection approaches implicitly assume that misinformation is static. We introduce MPCG, a multi-round, persona-conditioned framework that simulates how claims are iteratively reinterpreted by agents with distinct ideological perspectives. Our approach uses an uncensored large language model (LLM) to generate persona-specific claims across multiple rounds, conditioning each generation on outputs from the previous round, enabling the study of misinformation evolution. We evaluate the generated claims through human and LLM-based annotations, cognitive effort metrics (readability, perplexity), emotion evocation metrics (sentiment analysis, morality), clustering, feasibility, and downstream classification. Results show strong agreement between human and GPT-4o-mini annotations, with higher divergence in fluency judgments. Generated claims require greater cognitive effort than the original claims and consistently reflect persona-aligned emotional and moral framing. Clustering and cosine similarity analyses confirm semantic drift across rounds while preserving topical coherence. Feasibility results show a 77% feasibility rate, confirming suitability for downstream tasks. Classification results reveal that commonly used misinformation detectors experience macro-F1 performance drops of up to 49.7%. The code is available at https://github.com/bcjr1997/MPCG

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

MPCG: Multi-Round Persona-Conditioned Generation for Modeling the Evolution of Misinformation with LLMs

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

A Machine Learning Approach for Detection of Mental Health Conditions and Cyberb...

Listening Between the Lines: Decoding Podcast Narratives with Language Modeling

Social Simulations with Large Language Model Risk Utopian Illusion

A Generalizable Rhetorical Strategy Annotation Model Using LLM-based Debate Simu...

Good Intentions Beyond ACL: Who Does NLP for Social Good, and Where?

Навигация