Large-Scale, Longitudinal Study of Large Language Models During the 2024 US Election Season

2509.18446v1 cs.CY, cs.LG 2025-09-25
Авторы:

Sarah H. Cen, Andrew Ilyas, Hedi Driss, Charlotte Park, Aspen Hopkins, Chara Podimata, Aleksander Mądry

Резюме на русском

## Контекст Это исследование рассматривает роль больших языковых моделей (LLMs) во времена предстоящих выборов в США 2024 года. Это первый по сути выборный период, происходящий в условиях распространенности LLMs, что вызывает вопросы о потенциальной их влиянии на публичное мнение и политический дискурс. Даже несмотря на то, что платформы объявляют меры безопасности, их эффективность в реальной ситуации до сих пор неясна. Данное исследование является обширным и длительным, включая 12 моделей, которые подвергались тестированию при помощи 12,000+ как можно более структурированных вопросов, обновлявшихся почти ежедневно с июля по ноябрь 2024 года. Такой подход позволил охватить многообразные аспекты влияния LLMs на информационную среду во время выборов. ## Метод Исследование базируется на структурированном подходе, который включает в себя широкий спектр тестов и моделирования. 12 LLMs были изучены с помощью опросника с вопросами, разбитыми на категории для оценки различных аспектов поведения моделей. Эти модели проверялись почти ежедневно в течение более чем четырех месяцев. Ответы были систематически анализированы, чтобы понять, насколько LLMs отвечают на вопросы в зависимости от указаний, их эволюция во времени, а также влияние демографических факторов на свои ответы. Эта методология позволяет получить тщательное понимание функционирования LLMs в контексте выборов. ## Результаты Результаты исследования показывают, что LLMs подвержены существенным изменениям в поведении в процессе выборного периода. Например, они оказались чувствительны к тем стереотипам и предрассудкам, которые сопровождают политический дискурс. Кроме того, их ответы сильно зависили от демографических факторов, что могло влиять на политические предпочтения людей. Изученные модели также содержали неточности в своих представлениях о кандидатах и имели некоторые "убеждения" о результатах выборов. Эти результаты демонстрируют, насколько проблематичными могут быть LLMs в политическом контексте. ## Значимость Результаты имеют значительное значение для развития политической коммуникации и стратегий управления информацией в эпоху AI. Это исследование показывает, насколько LLMs могут стать фактором влияния на политические решения, что может повлиять на демократический процесс. Изучение поведения LLMs может помочь в разработке методов противодействия их влиянию, а также в оценке рисков, связанных с их использованием во время выборов. Это имеет перспективу для широкого круга приложений, от мониторин

Abstract

The 2024 US presidential election is the first major contest to occur in the US since the popularization of large language models (LLMs). Building on lessons from earlier shifts in media (most notably social media's well studied role in targeted messaging and political polarization) this moment raises urgent questions about how LLMs may shape the information ecosystem and influence political discourse. While platforms have announced some election safeguards, how well they work in practice remains unclear. Against this backdrop, we conduct a large-scale, longitudinal study of 12 models, queried using a structured survey with over 12,000 questions on a near-daily cadence from July through November 2024. Our design systematically varies content and format, resulting in a rich dataset that enables analyses of the models' behavior over time (e.g., across model updates), sensitivity to steering, responsiveness to instructions, and election-related knowledge and "beliefs." In the latter half of our work, we perform four analyses of the dataset that (i) study the longitudinal variation of model behavior during election season, (ii) illustrate the sensitivity of election-related responses to demographic steering, (iii) interrogate the models' beliefs about candidates' attributes, and (iv) reveal the models' implicit predictions of the election outcome. To facilitate future evaluations of LLMs in electoral contexts, we detail our methodology, from question generation to the querying pipeline and third-party tooling. We also publicly release our dataset at https://huggingface.co/datasets/sarahcen/llm-election-data-2024

Ссылки и действия