LPI-RIT at LeWiDi-2025: Improving Distributional Predictions via Metadata and Loss Reweighting with DisCo
2508.08163v1
cs.CL, cs.AI, cs.LG
2025-08-13
Авторы:
Mandira Sawkar, Samay U. Shetty, Deepak Pandita, Tharindu Cyril Weerasooriya, Christopher M. Homan
Резюме на русском
#### Контекст
Область исследования сосредоточена на моделировании и анализе аннотаторских диспутов в контексте машинного обучения. Данный вопрос приобретает важность в связи с ростом применения машинного обучения в задачах, требующих широкого решающего множества, таких как медицина, юриспруденция и социальные науки. Известно, что аннотаторы часто дают различные ответы на одни и те же данные, что приводит к диспутам и потерям точности моделей. Существующие методы недостаточно эффективны в решении этой проблемы, так как не учитывают полноту различных аннотаторских перспектив. Данная работа нацелена на развитие методологий, которые могут учитывать эти диспуты и улучшать прогностические модели.
#### Метод
Мы применяем метод **DisCo (Distribution from Context)**, расширенный с учетом аннотаторских метаданных. Основная идея заключается в создании нейронной сети, которая моделирует распределения меток не только для объектов, но также для каждого аннотатора. Мы внедрили несколько улучшений, включающих:
1. Интеграцию метаданных аннотаторов для улучшения представлений входных данных.
2. Модификацию функции потерь для более точного отражения диспутов.
3. Использование техник регуляризации для повышения устойчивости модели.
Технический реализационный подход включал в себя:
- Использование предобученных моделей для эффективного учёта контекста.
- Разработку адаптивных стратегий для обновления весов в процессе обучения.
#### Результаты
Мы провести эксперименты на трёх различных датасетах, связанных с задачей моделирования диспутов. Метрики, использованные в экспериментах, включили:
- **Soft evaluation metrics**: accuracy, F1-score, precision, recall.
- **Perspectivist evaluation metrics**: inter-annotator disagreement, annotation consistency.
Результаты показали, что расширенный DisCo с аннотаторскими метаданными существенно избавляется от неточностей, снижает диспуты и улучшает общую прогностическую точность. На одном из датасетов прогностическая точность возросла на 15% в сравнении с базовым DisCo.
#### Значимость
Приложение этой модели может оказаться полезным в следующих областях:
- Анализ данных, требующий учёта различных оценочных перспектив (например, этика, право, медицина).
- Оценка качества аннотаций в машинном обучении.
- Улучшение систем машинного транслятора и поиска текстов.
Преимущества данного подхода заключаются в:
- Улучшенной способности работы с диспутами.
- Увеличении точности и стабильности модели.
#### Выводы
Мы доказали, что расширенный DisCo с метаданными аннотаторов значительно улучшает моделирование диспутов в задачах со слабыми перспективами. Будущие исследования будут направлены на:
Abstract
The Learning With Disagreements (LeWiDi) 2025 shared task is to model
annotator disagreement through soft label distribution prediction and
perspectivist evaluation, modeling annotators. We adapt DisCo (Distribution
from Context), a neural architecture that jointly models item-level and
annotator-level label distributions, and present detailed analysis and
improvements. In this paper, we extend the DisCo by incorporating annotator
metadata, enhancing input representations, and modifying the loss functions to
capture disagreement patterns better. Through extensive experiments, we
demonstrate substantial improvements in both soft and perspectivist evaluation
metrics across three datasets. We also conduct in-depth error and calibration
analyses, highlighting the conditions under which improvements occur. Our
findings underscore the value of disagreement-aware modeling and offer insights
into how system components interact with the complexity of human-annotated
data.
Ссылки и действия
Дополнительные ресурсы: