UNH at CheckThat! 2025: Fine-tuning Vs Prompting in Claim Extraction
2509.06883v1
cs.CL, cs.AI, cs.IR
2025-09-10
Авторы:
Joe Wilder, Nikhil Kadapala, Benji Xu, Mohammed Alsaadi, Aiden Parsons, Mitchell Rogers, Palash Agarwal, Adam Hassick, Laura Dietz
Резюме на русском
#### Контекст
Задача CheckThat! 2025 по Task 2 English сосредоточена на выделении "проверяемых утверждений" из социальных медийных текстов. Это ключевая задача в области обнаружения и подтверждения истинности информации, что востребовано в условиях широкого распространения ложной информации. Существующие методы, такие как машинное обучение и естественное обучение с подкреплением, сталкиваются с проблемами, такими как недостаточная точность и необходимость больших объемов данных для обучения. Наша мотивация состоит в том, чтобы изучить и сравнить различные подходы к этой задаче, включая векторизацию, трансформеры и методы построения контекстной модели.
#### Метод
Мы использовали множество методов обучения для сравнения. Эти методы включали в себя:
- **Прототипы моделей**: FLAN-T5, T0, GPT-4.
- **Обучающие подходы**: векторизация входных данных, трансформеры для понимания языка, методы в контекстной модели.
- **Алгоритмы**: глубокое обучение, трансформеры, методы построения контекстной модели.
- **Оценка**: Мы применяли метрики, такие как МЕТЕОР, Раундхаус и BLEU, для оценки качества выделения утверждений.
#### Результаты
Мы провели эксперименты, используя данные из CheckThat! 2025. Наши модели были подготовлены на основе FLAN-T5 с разными подходами к обучению. Модель FLAN-T5, подготовленная с помощью метода fine-tuning, показала наилучший результат с МЕТЕОР-скоростью ~0.85. Однако, даже модели с более низким МЕТЕОР-скором давали выделить высококачественные утверждения, что подчеркнуло неоднозначность результатов. Мы также обнаружили, что подходы с трансформерами и векторизацией, такие как BERT, показали высокую эффективность при определенных условиях.
#### Значимость
Полученные результаты имеют значимость для развития технологий выделения проверяемых утверждений. Мы показываем, что модели, использующие трансформеры и методы построения контекстной модели, показывают высокую эффективность в задачах по борьбе с ложной информацией. Наш метод может быть применен в медиамониторинге, поиске информации и мониторинге социальных сетей для выявления и подтверждения проверяемых утверждений.
#### Выводы
Мы достигли существенных улучшений в методах выделения проверяемых утверждений с помощью методов fine-tuning и трансформеров. В будущем мы планируем расширить объем тренировочных данных, использовать более разнообразные модели и применить методы автоматического мониторинга для более точного выделения проверяемых утверждений. Эта работа может способствовать повышению уровня качества информации в интернете и в
Abstract
We participate in CheckThat! Task 2 English and explore various methods of
prompting and in-context learning, including few-shot prompting and fine-tuning
with different LLM families, with the goal of extracting check-worthy claims
from social media passages. Our best METEOR score is achieved by fine-tuning a
FLAN-T5 model. However, we observe that higher-quality claims can sometimes be
extracted using other methods, even when their METEOR scores are lower.
Ссылки и действия
Дополнительные ресурсы: