AIRwaves at CheckThat! 2025: Retrieving Scientific Sources for Implicit Claims on Social Media with Dual Encoders and Neural Re-Ranking

2509.19509v1 cs.IR, cs.AI, cs.LG 2025-09-26
Авторы:

Cem Ashbaugh, Leon Baumgärtner, Tim Gress, Nikita Sidorov, Daniel Werner

Резюме на русском

#### Контекст В условиях повсеместного использования социальных сетей в качестве источников информации возникает критически важная проблема — точного сопоставления неявных утверждений, сделанных в социальных медиа, с их источниками в научной литературе. Это необходимо для эффективного доказательства фактов, ноу-хау-создания и развития научных дискуссий. Однако это задача сложная из-за lexical sparsity (ограниченности лексического варианта), очень коротких запросов и доменно-ориентированной лексикографии, которые существенно затрудняют обнаружение соответствий. На CLEF-2025 CheckThat! LAB в рамках Subtask 4b, посвященном этому вопросу, команда AIRwaves стала второй, предложив мощный и эффективный подход к решению данной проблемы. #### Метод Выполнение этой задачи предлагается в двух этапах. На первом этапе применяется алгоритм sparse retrieval, оптимизированный с использованием BM25. На втором этапе вводится новая архитектура, основанная на dual encoder и neural re-ranking. Dual encoder тренируется на большом датасете с использованием in-batch и mined hard negatives, а также чанкированием токенов и добавлением дополнительной метаинформации в документы. Для дополнительной оценки релевантности используется SciBERT cross-encoder для neural re-ranking. Этот подход позволяет сильно повысить качество сравнения запросов и документов, превратив лишь lexical matching в размерность нейронных представлений. #### Результаты Проведенные эксперименты показали высокую эффективность предложенного подхода. На gold label blind test set, стандартный sparse retrieval (BM25) показал MRR@5 = 0.5025. Однако использование dual encoder способствовало повышению результатов до MRR@5 = 0.6174, а полностью модель, включающую neural re-ranking, показала совершенно новый результат — MRR@5 = 0.6828. Это значительно превосходит остальные конкуренты и демонстрирует эффективность комбинации dense retrieval с neural re-ranking в решении задачи tweet-to-study matching. #### Значимость Предложенный подход имеет широкие применения в области evidence-based fact-checking, scientific discourse и academic research. Он обеспечивает более точное и эффективное сопоставление неявных утверждений со своими источниками, что повышает качество контента и помогает улучшить трансформационные процессы в науке. Решение также демонстрирует возможности neural re-rankers в улучшении sparse retrieval, что может быть применено в других областях, где требуется высокоточное соотнесение коротких запросов с документами. #### Выводы Проведенные исследования демонстрируют, что модель AIRwaves представляет собой эффективное и надежное решение для tweet-to-study matching. Она улучшает значительно качество сравнения запросов и документов, используя dual encoder и neural re-ranking. Будущие исследования будут фокусироваться на расширении датасетов, улучшении cross-encoder и исследовании других моделей, по

Abstract

Linking implicit scientific claims made on social media to their original publications is crucial for evidence-based fact-checking and scholarly discourse, yet it is hindered by lexical sparsity, very short queries, and domain-specific language. Team AIRwaves ranked second in Subtask 4b of the CLEF-2025 CheckThat! Lab with an evidence-retrieval approach that markedly outperforms the competition baseline. The optimized sparse-retrieval baseline(BM25) achieves MRR@5 = 0.5025 on the gold label blind test set. To surpass this baseline, a two-stage retrieval pipeline is introduced: (i) a first stage that uses a dual encoder based on E5-large, fine-tuned using in-batch and mined hard negatives and enhanced through chunked tokenization and rich document metadata; and (ii) a neural re-ranking stage using a SciBERT cross-encoder. Replacing purely lexical matching with neural representations lifts performance to MRR@5 = 0.6174, and the complete pipeline further improves to MRR@5 = 0.6828. The findings demonstrate that coupling dense retrieval with neural re-rankers delivers a powerful and efficient solution for tweet-to-study matching and provides a practical blueprint for future evidence-retrieval pipelines.

Ссылки и действия