Large-Scale, Longitudinal Study of Large Language Models During the 2024 US Election Season
2509.18446v1
cs.CY, cs.LG
2025-09-25
Авторы:
Sarah H. Cen, Andrew Ilyas, Hedi Driss, Charlotte Park, Aspen Hopkins, Chara Podimata, Aleksander Mądry
Резюме на русском
## Контекст
Это исследование рассматривает роль больших языковых моделей (LLMs) во времена предстоящих выборов в США 2024 года. Это первый по сути выборный период, происходящий в условиях распространенности LLMs, что вызывает вопросы о потенциальной их влиянии на публичное мнение и политический дискурс. Даже несмотря на то, что платформы объявляют меры безопасности, их эффективность в реальной ситуации до сих пор неясна. Данное исследование является обширным и длительным, включая 12 моделей, которые подвергались тестированию при помощи 12,000+ как можно более структурированных вопросов, обновлявшихся почти ежедневно с июля по ноябрь 2024 года. Такой подход позволил охватить многообразные аспекты влияния LLMs на информационную среду во время выборов.
## Метод
Исследование базируется на структурированном подходе, который включает в себя широкий спектр тестов и моделирования. 12 LLMs были изучены с помощью опросника с вопросами, разбитыми на категории для оценки различных аспектов поведения моделей. Эти модели проверялись почти ежедневно в течение более чем четырех месяцев. Ответы были систематически анализированы, чтобы понять, насколько LLMs отвечают на вопросы в зависимости от указаний, их эволюция во времени, а также влияние демографических факторов на свои ответы. Эта методология позволяет получить тщательное понимание функционирования LLMs в контексте выборов.
## Результаты
Результаты исследования показывают, что LLMs подвержены существенным изменениям в поведении в процессе выборного периода. Например, они оказались чувствительны к тем стереотипам и предрассудкам, которые сопровождают политический дискурс. Кроме того, их ответы сильно зависили от демографических факторов, что могло влиять на политические предпочтения людей. Изученные модели также содержали неточности в своих представлениях о кандидатах и имели некоторые "убеждения" о результатах выборов. Эти результаты демонстрируют, насколько проблематичными могут быть LLMs в политическом контексте.
## Значимость
Результаты имеют значительное значение для развития политической коммуникации и стратегий управления информацией в эпоху AI. Это исследование показывает, насколько LLMs могут стать фактором влияния на политические решения, что может повлиять на демократический процесс. Изучение поведения LLMs может помочь в разработке методов противодействия их влиянию, а также в оценке рисков, связанных с их использованием во время выборов. Это имеет перспективу для широкого круга приложений, от мониторин
Abstract
The 2024 US presidential election is the first major contest to occur in the
US since the popularization of large language models (LLMs). Building on
lessons from earlier shifts in media (most notably social media's well studied
role in targeted messaging and political polarization) this moment raises
urgent questions about how LLMs may shape the information ecosystem and
influence political discourse. While platforms have announced some election
safeguards, how well they work in practice remains unclear. Against this
backdrop, we conduct a large-scale, longitudinal study of 12 models, queried
using a structured survey with over 12,000 questions on a near-daily cadence
from July through November 2024. Our design systematically varies content and
format, resulting in a rich dataset that enables analyses of the models'
behavior over time (e.g., across model updates), sensitivity to steering,
responsiveness to instructions, and election-related knowledge and "beliefs."
In the latter half of our work, we perform four analyses of the dataset that
(i) study the longitudinal variation of model behavior during election season,
(ii) illustrate the sensitivity of election-related responses to demographic
steering, (iii) interrogate the models' beliefs about candidates' attributes,
and (iv) reveal the models' implicit predictions of the election outcome. To
facilitate future evaluations of LLMs in electoral contexts, we detail our
methodology, from question generation to the querying pipeline and third-party
tooling. We also publicly release our dataset at
https://huggingface.co/datasets/sarahcen/llm-election-data-2024
Ссылки и действия
Дополнительные ресурсы: