Modeling Annotator Disagreement with Demographic-Aware Experts and Synthetic Perspectives
2508.02853v1
cs.CL
2025-08-09
Авторы:
Yinuo Xu, Veronica Derricks, Allison Earl, David Jurgens
Резюме на русском
Мы предлагаем модель DEM-MoE (Demographic-Aware Mixture of Experts) для моделирования аннотаторского диспута в субъективных NLP-задачах. Модель использует архитектуру Mixture of Experts, в которой входные данные являются группами аннотаторов, определяемых их демографическими признаками. Это позволяет более точно представлять структурированные различия между группами. Модель показала высокую эффективность на датасетах с высоким диспутом между аннотаторами. Также мы исследовали использование синтетических аннотаций, генерируемых трансформерами с нулевым выстрелом, чтобы компенсировать нехватку демографического покрытия. Оказалось, что эти синтетические данные могут значительно улучшить модель, особенно при оптимальном структурировании микширования реальных и синтетических данных. Эти результаты демонстрируют, что модель DEM-MoE может значительно улучшить представление разногодичности в NLP.
Abstract
We present an approach to modeling annotator disagreement in subjective NLP
tasks through both architectural and data-centric innovations. Our model,
DEM-MoE (Demographic-Aware Mixture of Experts), routes inputs to expert
subnetworks based on annotator demographics, enabling it to better represent
structured, group-level variation compared to prior models. DEM-MoE
consistently performs competitively across demographic groups, and shows
especially strong results on datasets with high annotator disagreement. To
address sparse demographic coverage, we test whether LLM-generated synthetic
annotations via zero-shot persona prompting can be used for data imputation. We
show these synthetic judgments align moderately well with human annotations on
our data and offer a scalable way to potentially enrich training data. We then
propose and evaluate approaches for blending real and synthetic data using
strategies tailored to dataset structure. We find that the optimal strategies
depend on dataset structure. Together, these contributions improve the
representation of diverse perspectives.
Ссылки и действия
Дополнительные ресурсы: