Combating Biomedical Misinformation through Multi-modal Claim Detection and Evidence-based Verification

2509.13888v1 cs.CL, cs.AI, cs.IR 2025-09-19
Авторы:

Mariano Barone, Antonio Romano, Giuseppe Riccio, Marco Postiglione, Vincenzo Moscato

Резюме на русском

#### Контекст Информационная миссинформация в окружении биомедицины, включая тренить с вакцинами и недоказанные лекарственные терапии, представляет вразумительные угрозы для общественной здравоохранной здоровья и поддержки научной литературы. Из-за сложных терминологий, тематических особенностей и критической роли убедительных данных, автоматизированное проверка фактов в этой области остается вызовом. Наша работа посвящена созданию нового фреймворка, который объединяет методы верификации, основанные на научных источниках и расширенные модели языка для повышения точности и надёжности факт-чекинга. #### Метод Мы предлагаем фреймворк CER (Combining Evidence and Reasoning), который сочетает в себе три основных модуля: верификация на основе научных статей, выводы с использованием группы языковых моделей и проверку предположений с помощью супервизованной модели. Используя текстовые генерации глубоких моделей, CER обеспечивает глубокую интеграцию с научной литературой, уменьшая вероятность вывода недостоверных предложений. Были применены специальные методы для поиска и отображения высококачественных данных из биомедицинских источников. #### Результаты Для оценки точности и эффективности фреймворка CER, мы провели эксперименты на трёх специализированных датасетах: HealthFC, BioASQ-7b и SciFact. Результаты показали, что CER превосходит существующие модели по нескольким метрикам, включая точность и всеобъемлющий показатель. Эксперименты с кросс-датасетовными проверками свидетельствуют о хорошей универсальности фреймворка. Код и данные доступны в репозитории на GitHub (https://github.com/PRAISELab-PicusLab/CER), чтобы обеспечить прозрачность и возможность повторения исследований. #### Значимость Фреймворк CER может быть применён в различных сферах, включая образовательные ресурсы, здравоохранение и политику в области здоровья. Он обеспечивает автоматизированную проверку фактов с высокой точностью, уменьшая время и ресурсы, необходимые для интерпретации биомедицинских данных. Это может способствовать улучшению общей доверительной ситуации в медицине и усилению научного осведомлённости в обществе. #### Выводы Наша работа доказывает, что CER является новым эффективным подходом к проверке биомедицинских утверждений. Он объединяет расширенные технологии языковых моделей и методы поиска научных данных для достижения высокой точности и надёжности процесса верификации. Будущие исследования будут стремиться расширить применение CER к различным биомедицинским тасклам и улучшить его надёжность в реальных условиях.

Abstract

Misinformation in healthcare, from vaccine hesitancy to unproven treatments, poses risks to public health and trust in medical systems. While machine learning and natural language processing have advanced automated fact-checking, validating biomedical claims remains uniquely challenging due to complex terminology, the need for domain expertise, and the critical importance of grounding in scientific evidence. We introduce CER (Combining Evidence and Reasoning), a novel framework for biomedical fact-checking that integrates scientific evidence retrieval, reasoning via large language models, and supervised veracity prediction. By integrating the text-generation capabilities of large language models with advanced retrieval techniques for high-quality biomedical scientific evidence, CER effectively mitigates the risk of hallucinations, ensuring that generated outputs are grounded in verifiable, evidence-based sources. Evaluations on expert-annotated datasets (HealthFC, BioASQ-7b, SciFact) demonstrate state-of-the-art performance and promising cross-dataset generalization. Code and data are released for transparency and reproducibility: https://github.com/PRAISELab-PicusLab/CER

Ссылки и действия