Modeling Annotator Disagreement with Demographic-Aware Experts and Synthetic Perspectives

2508.02853v1 cs.CL 2025-08-09
Авторы:

Yinuo Xu, Veronica Derricks, Allison Earl, David Jurgens

Резюме на русском

Мы предлагаем модель DEM-MoE (Demographic-Aware Mixture of Experts) для моделирования аннотаторского диспута в субъективных NLP-задачах. Модель использует архитектуру Mixture of Experts, в которой входные данные являются группами аннотаторов, определяемых их демографическими признаками. Это позволяет более точно представлять структурированные различия между группами. Модель показала высокую эффективность на датасетах с высоким диспутом между аннотаторами. Также мы исследовали использование синтетических аннотаций, генерируемых трансформерами с нулевым выстрелом, чтобы компенсировать нехватку демографического покрытия. Оказалось, что эти синтетические данные могут значительно улучшить модель, особенно при оптимальном структурировании микширования реальных и синтетических данных. Эти результаты демонстрируют, что модель DEM-MoE может значительно улучшить представление разногодичности в NLP.

Abstract

We present an approach to modeling annotator disagreement in subjective NLP tasks through both architectural and data-centric innovations. Our model, DEM-MoE (Demographic-Aware Mixture of Experts), routes inputs to expert subnetworks based on annotator demographics, enabling it to better represent structured, group-level variation compared to prior models. DEM-MoE consistently performs competitively across demographic groups, and shows especially strong results on datasets with high annotator disagreement. To address sparse demographic coverage, we test whether LLM-generated synthetic annotations via zero-shot persona prompting can be used for data imputation. We show these synthetic judgments align moderately well with human annotations on our data and offer a scalable way to potentially enrich training data. We then propose and evaluate approaches for blending real and synthetic data using strategies tailored to dataset structure. We find that the optimal strategies depend on dataset structure. Together, these contributions improve the representation of diverse perspectives.

Ссылки и действия