DeMeVa at LeWiDi-2025: Modeling Perspectives with In-Context Learning and Label Distribution Learning
2509.09524v1
cs.CL, cs.LG
2025-09-13
Авторы:
Daniil Ignatev, Nan Li, Hugh Mee Wong, Anh Dang, Shane Kaszefski Yaschuk
Резюме на русском
## Контекст
Многообразие представлений в современной общественной сфере требует развития моделей, которые могут эффективно обрабатывать и агрегировать различные точки зрения. Особенно актуальным становится применение таких моделей в области анализа текстов, где необходимо учитывать не только контекст, но и разнообразие в интерпретации текстов различными пользователями.
"DeMeVa at LeWiDi-2025" — это системная работа, посвященная задаче Learning with Disagreements (LeWiDi) 2025, которая фокусируется на моделировании точек зрения в контексте разногласий в мнениях. Исследователям необходимо разработать модели, которые могут не только точно предсказывать мнения пользователей, но и проявлять гибкость в агрегировании разных взглядов.
## Метод
Для решения задачи использовались два подхода: **In-Context Learning (ICL)** и **Label Distribution Learning (LDL)**.
**ICL** состоит в том, что тексты тренировочных данных выступают в роли примеров для подсказок генерации soft-labels в контексте новых данных. Для эффективного использования ICL рассматривались различные стратегии выбора примеров, включая случайную выборку, селективную выборку и стратегию семантического схожести.
**LDL** включает в себя методы, основанные на предсказании распределения между множеством классов, что применимо для моделирования мнений пользователей. Рассматривались методы файн-тюнинга с использованием модели RoBERTa, чтобы оптимизировать процесс предсказания распределений.
## Результаты
Использовались разные наборы данных, включая текстовые сценарии, где необходимо было предсказать мнения пользователей.
**ICL** показал высокую точность в предсказании точек зрения пользователей. Особенно эффективна была стратегия выбора примеров семантической схожести, которая позволяла модели более точно предсказывать тенденции в индивидуальных восприятиях.
**LDL** показал потенциал для предсказания распределений между множеством классов, которые могут интерпретироваться как мнения пользователей. Методы файн-тюнинга с RoBERTa позволяли улучшить точность и достичь конкурентоспособных результатов.
## Значимость
Результаты этих подходов могут быть применены в различных областях, где необходимо учитывать разногласия в мнениях, таких как социальный анализ, моделирование дискуссий в социальных сетях или анализ тональности в текстах.
**Преимущества** ICL заключаются в том, что он может эффективно предсказывать точки зрения пользователей, а LDL — в том, что он предлагает новый подход к моделированию распределений между множеством классов.
**Потенциальное влияние** — расширение возможностей моделей для анализа и агрегирования разногласий в мнениях
Abstract
This system paper presents the DeMeVa team's approaches to the third edition
of the Learning with Disagreements shared task (LeWiDi 2025; Leonardelli et
al., 2025). We explore two directions: in-context learning (ICL) with large
language models, where we compare example sampling strategies; and label
distribution learning (LDL) methods with RoBERTa (Liu et al., 2019b), where we
evaluate several fine-tuning methods. Our contributions are twofold: (1) we
show that ICL can effectively predict annotator-specific annotations
(perspectivist annotations), and that aggregating these predictions into soft
labels yields competitive performance; and (2) we argue that LDL methods are
promising for soft label predictions and merit further exploration by the
perspectivist community.
Ссылки и действия
Дополнительные ресурсы: