What Is The Political Content in LLMs' Pre- and Post-Training Data?

2509.22367v1 cs.CL, cs.AI, cs.CY 2025-09-30

Авторы:

Tanise Ceron, Dmitry Nikolaev, Dominik Stammbach, Debora Nozza

Резюме на русском

#### Контекст Large language models (LLMs) широко используются в различных сферах, но одной из их характеристик является политическая биаз. Несмотря на то, что политические предрассудки моделей часто обсуждаются, их происхождение и источники остаются малоизученными. Одним из ключевых аспектов понимания этого явления является анализ политического содержания данных, используемых в обучении моделей. В настоящем исследовании анализируется содержание данных, использованных в обучении модели OLMO2, последней полностью открытой модели, выпущенной с открытым исходным кодом и её полным набором данных. Эта работа призвана раскрыть, как политический контент в данных влияет на политический биаз моделей. #### Метод Для анализа использовались пре- и пост-тренировочные данные модели OLMO2. Данные автоматически аннотированы с использованием методов автоматического определения политического ориентира документов. Для обеспечения точности использовались различные источники данных, включая новостные статьи, политические мемы и другие тексты. Для анализа использовались методы статистического анализа и машинного обучения для выявления зависимостей между политическим содержанием данных и политическим биазом модели. #### Результаты Изучение политического содержания данных показало, что пре-тренировочные данные OLMO2 содержат сильно выраженное политическое содержание, которое значительно превышает политическую активность в пост-тренировочных данных. Также выявлено, что эти данные в основном относятся к левосторонней политической ориентации. Было выявлено, что политические тексты окраинных политических позиций формулируются с различными легітимностью и ценностями. Анализ показал, что политический биаз в данных сильно коррелирует с политическим биазом модели при оценке политических вопросов. #### Значимость Результаты имеют значимость для широких областей применения, включая разработку более ответственных моделей, анализ политических предрассудков в тексте. Изучение политического содержания данных позволит создавать более транспарентные модели и избегать политических предрассудков при их используемой. Данные результаты также могут быть использованы для расширения понимания политических предрассудков в машинном обучении и разработки новых подходов к оценке и контролю политического содержания данных. #### Выводы Исследование показало, что политический содержание в данных является ключевым фактором, влияющим на политический биаз моделей. Найдено, что политическое содержание в пре-тренировочных данных значительно влияет на политический биаз модели в пост-тренировочном этапе. Будущи

Abstract

Large language models (LLMs) are known to generate politically biased text, yet how such biases arise remains unclear. A crucial step toward answering this question is the analysis of training data, whose political content remains largely underexplored in current LLM research. To address this gap, we present in this paper an analysis of the pre- and post-training corpora of OLMO2, the largest fully open-source model released together with its complete dataset. From these corpora, we draw large random samples, automatically annotate documents for political orientation, and analyze their source domains and content. We then assess how political content in the training data correlates with models' stance on specific policy issues. Our analysis shows that left-leaning documents predominate across datasets, with pre-training corpora containing significantly more politically engaged content than post-training data. We also find that left- and right-leaning documents frame similar topics through distinct values and sources of legitimacy. Finally, the predominant stance in the training data strongly correlates with models' political biases when evaluated on policy issues. These findings underscore the need to integrate political content analysis into future data curation pipelines as well as in-depth documentation of filtering strategies for transparency.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

What Is The Political Content in LLMs' Pre- and Post-Training Data?

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

No Free Lunch in Language Model Bias Mitigation? Targeted Bias Reduction Can Exa...

Reinforcing Stereotypes of Anger: Emotion AI on African American Vernacular Engl...

Moral Susceptibility and Robustness under Persona Role-Play in Large Language Mo...

LocalBench: Benchmarking LLMs on County-Level Local Knowledge and Reasoning

AI Diffusion in Low Resource Language Countries

Навигация