Population-Scale Network Embeddings Expose Educational Divides in Network Structure Related to Right-Wing Populist Voting
2508.21236v1
cs.SI, cs.LG, stat.AP, J.4
2025-09-02
Авторы:
Malte Lüken, Javier Garcia-Bernardo, Sreeparna Deb, Flavio Hafner, Megha Khosla
Резюме на русском
#### Контекст
Современные общества часто организованы вокруг сетевых структур, где люди связаны с помощью различных социальных контекстов, таких как соседство, работа, семья и образование. Однако существуют значительные различия в доступе к ресурсам и возможностям в разных социальных сетях. Одна из таких различий — уровень образования — может оказать сильное влияние на политические предпочтения, включая голосование за правые популистские партии. Данное исследование концентрируется на изучении связи между социальными сетями, образовательными различиями и голосованием за правые популистские партии, используя методы машинного обучения для построения и интерпретирования моделей сетей на уровне населения.
#### Метод
Для строительения моделей сетей использовались реестры административных данных, которые позволили построить популяционно-масштабные сети, где взаимосвязи между людьми отражались в социальных контекстах. Использованная архитектура машинного обучения позволила получить сетевые представления — embeddings — для каждого человека, которые автоматически характеризуют его положение в сети. Для оценки информативности этих моделей произведено предсказание голосования за правые популистские партии. Для этого результаты сравнивались с использованием только индивидуальных характеристик, таких как возраст и пол. Для улучшения интерпретируемости моделей предпринято техническое преобразование embeddings, сделав их более четкими и ортогональными.
#### Результаты
Использование только embeddings для предсказания голосования за правые популистские партии показало незначительное превосходство над произвольным угадыванием. Однако при комбинировании этих моделей с индивидуальными характеристиками, такими как возраст и пол, улучшение было незначительным. Однако после технического преобразования embeddings, которое уменьшило меру корреляции между их компонентами, одна компонента особенно сильно связана с голосованием за правые популистские партии. Анализ этой компоненты вместе с сетевыми данными показал, что различия в структуре сетей, связанные с образовательными различиями, вносят значимый вклад в формирование политических предпочтений.
#### Значимость
Результаты этого исследования имеют многочисленные потенциальные применения в области политического прогнозирования, социальных наук и практике. Они демонстрируют, как population-scale network embeddings могут быть интерпретированы для выявления социальных различий в структурах сетей. Такие различие могут иметь неотъемлемое значение для понимания факторов, влияющих на политические предпочтения. Этот подход также открывает новые возможности для
Abstract
Administrative registry data can be used to construct population-scale
networks whose ties reflect shared social contexts between persons. With
machine learning, such networks can be encoded into numerical representations
-- embeddings -- that automatically capture individuals' position within the
network. We created embeddings for all persons in the Dutch population from a
population-scale network that represents five shared contexts: neighborhood,
work, family, household, and school. To assess the informativeness of these
embeddings, we used them to predict right-wing populist voting. Embeddings
alone predicted right-wing populist voting above chance-level but performed
worse than individual characteristics. Combining the best subset of embeddings
with individual characteristics only slightly improved predictions. However,
after transforming the embeddings to make their dimensions more sparse and
orthogonal, we found that one embedding dimension was strongly associated with
the outcome. Mapping this dimension back to the population network revealed
differences in network structure related to right-wing populist voting between
different school ties and achieved education levels. Our study contributes
methodologically by demonstrating how population-scale network embeddings can
be made interpretable, and substantively by linking structural network
differences in education to right-wing populist voting.