DeMeVa at LeWiDi-2025: Modeling Perspectives with In-Context Learning and Label Distribution Learning

2509.09524v1 cs.CL, cs.LG 2025-09-13
Авторы:

Daniil Ignatev, Nan Li, Hugh Mee Wong, Anh Dang, Shane Kaszefski Yaschuk

Резюме на русском

## Контекст Многообразие представлений в современной общественной сфере требует развития моделей, которые могут эффективно обрабатывать и агрегировать различные точки зрения. Особенно актуальным становится применение таких моделей в области анализа текстов, где необходимо учитывать не только контекст, но и разнообразие в интерпретации текстов различными пользователями. "DeMeVa at LeWiDi-2025" — это системная работа, посвященная задаче Learning with Disagreements (LeWiDi) 2025, которая фокусируется на моделировании точек зрения в контексте разногласий в мнениях. Исследователям необходимо разработать модели, которые могут не только точно предсказывать мнения пользователей, но и проявлять гибкость в агрегировании разных взглядов. ## Метод Для решения задачи использовались два подхода: **In-Context Learning (ICL)** и **Label Distribution Learning (LDL)**. **ICL** состоит в том, что тексты тренировочных данных выступают в роли примеров для подсказок генерации soft-labels в контексте новых данных. Для эффективного использования ICL рассматривались различные стратегии выбора примеров, включая случайную выборку, селективную выборку и стратегию семантического схожести. **LDL** включает в себя методы, основанные на предсказании распределения между множеством классов, что применимо для моделирования мнений пользователей. Рассматривались методы файн-тюнинга с использованием модели RoBERTa, чтобы оптимизировать процесс предсказания распределений. ## Результаты Использовались разные наборы данных, включая текстовые сценарии, где необходимо было предсказать мнения пользователей. **ICL** показал высокую точность в предсказании точек зрения пользователей. Особенно эффективна была стратегия выбора примеров семантической схожести, которая позволяла модели более точно предсказывать тенденции в индивидуальных восприятиях. **LDL** показал потенциал для предсказания распределений между множеством классов, которые могут интерпретироваться как мнения пользователей. Методы файн-тюнинга с RoBERTa позволяли улучшить точность и достичь конкурентоспособных результатов. ## Значимость Результаты этих подходов могут быть применены в различных областях, где необходимо учитывать разногласия в мнениях, таких как социальный анализ, моделирование дискуссий в социальных сетях или анализ тональности в текстах. **Преимущества** ICL заключаются в том, что он может эффективно предсказывать точки зрения пользователей, а LDL — в том, что он предлагает новый подход к моделированию распределений между множеством классов. **Потенциальное влияние** — расширение возможностей моделей для анализа и агрегирования разногласий в мнениях

Abstract

This system paper presents the DeMeVa team's approaches to the third edition of the Learning with Disagreements shared task (LeWiDi 2025; Leonardelli et al., 2025). We explore two directions: in-context learning (ICL) with large language models, where we compare example sampling strategies; and label distribution learning (LDL) methods with RoBERTa (Liu et al., 2019b), where we evaluate several fine-tuning methods. Our contributions are twofold: (1) we show that ICL can effectively predict annotator-specific annotations (perspectivist annotations), and that aggregating these predictions into soft labels yields competitive performance; and (2) we argue that LDL methods are promising for soft label predictions and merit further exploration by the perspectivist community.

Ссылки и действия