Combating Biomedical Misinformation through Multi-modal Claim Detection and Evidence-based Verification
2509.13888v1
cs.CL, cs.AI, cs.IR
2025-09-19
Авторы:
Mariano Barone, Antonio Romano, Giuseppe Riccio, Marco Postiglione, Vincenzo Moscato
Резюме на русском
#### Контекст
Информационная миссинформация в окружении биомедицины, включая тренить с вакцинами и недоказанные лекарственные терапии, представляет вразумительные угрозы для общественной здравоохранной здоровья и поддержки научной литературы. Из-за сложных терминологий, тематических особенностей и критической роли убедительных данных, автоматизированное проверка фактов в этой области остается вызовом. Наша работа посвящена созданию нового фреймворка, который объединяет методы верификации, основанные на научных источниках и расширенные модели языка для повышения точности и надёжности факт-чекинга.
#### Метод
Мы предлагаем фреймворк CER (Combining Evidence and Reasoning), который сочетает в себе три основных модуля: верификация на основе научных статей, выводы с использованием группы языковых моделей и проверку предположений с помощью супервизованной модели. Используя текстовые генерации глубоких моделей, CER обеспечивает глубокую интеграцию с научной литературой, уменьшая вероятность вывода недостоверных предложений. Были применены специальные методы для поиска и отображения высококачественных данных из биомедицинских источников.
#### Результаты
Для оценки точности и эффективности фреймворка CER, мы провели эксперименты на трёх специализированных датасетах: HealthFC, BioASQ-7b и SciFact. Результаты показали, что CER превосходит существующие модели по нескольким метрикам, включая точность и всеобъемлющий показатель. Эксперименты с кросс-датасетовными проверками свидетельствуют о хорошей универсальности фреймворка. Код и данные доступны в репозитории на GitHub (https://github.com/PRAISELab-PicusLab/CER), чтобы обеспечить прозрачность и возможность повторения исследований.
#### Значимость
Фреймворк CER может быть применён в различных сферах, включая образовательные ресурсы, здравоохранение и политику в области здоровья. Он обеспечивает автоматизированную проверку фактов с высокой точностью, уменьшая время и ресурсы, необходимые для интерпретации биомедицинских данных. Это может способствовать улучшению общей доверительной ситуации в медицине и усилению научного осведомлённости в обществе.
#### Выводы
Наша работа доказывает, что CER является новым эффективным подходом к проверке биомедицинских утверждений. Он объединяет расширенные технологии языковых моделей и методы поиска научных данных для достижения высокой точности и надёжности процесса верификации. Будущие исследования будут стремиться расширить применение CER к различным биомедицинским тасклам и улучшить его надёжность в реальных условиях.
Abstract
Misinformation in healthcare, from vaccine hesitancy to unproven treatments,
poses risks to public health and trust in medical systems. While machine
learning and natural language processing have advanced automated fact-checking,
validating biomedical claims remains uniquely challenging due to complex
terminology, the need for domain expertise, and the critical importance of
grounding in scientific evidence. We introduce CER (Combining Evidence and
Reasoning), a novel framework for biomedical fact-checking that integrates
scientific evidence retrieval, reasoning via large language models, and
supervised veracity prediction. By integrating the text-generation capabilities
of large language models with advanced retrieval techniques for high-quality
biomedical scientific evidence, CER effectively mitigates the risk of
hallucinations, ensuring that generated outputs are grounded in verifiable,
evidence-based sources. Evaluations on expert-annotated datasets (HealthFC,
BioASQ-7b, SciFact) demonstrate state-of-the-art performance and promising
cross-dataset generalization. Code and data are released for transparency and
reproducibility: https://github.com/PRAISELab-PicusLab/CER
Ссылки и действия
Дополнительные ресурсы: