Combining Evidence and Reasoning for Biomedical Fact-Checking

2509.13879v1 cs.CL, cs.AI, cs.IR 2025-09-19
Авторы:

Mariano Barone, Antonio Romano, Giuseppe Riccio, Marco Postiglione, Vincenzo Moscato

Резюме на русском

Да ## Контекст Загруженность медицинских систем и внезапное возвращение многих заболеваний приводят к углубленному интересу к улучшению методов защиты организма. Одна из самых серьезных проблем в этой области является биомедицинское факт-чекинг, которое способствует улучшению общественного наблюдения за осведомленностью о здравоохранении и доверию к медицинским отделениям. Несмотря на то, что современные технологии машинного обучения и естественного языкового обработки позволяют автоматизировать часть процесса факт-чекинга, эта область остается недостаточно развитой из-за трудностей с верификацией биомедицинских утверждений. Эти утверждения часто имеют сложную терминологию, требуют специализированного знания, и требуют тщательной верификации на основе научных источников. Мы предлагаем **CER** (Combining Evidence and Reasoning), новую систему, которая активно интегрирует основные научные статьи, логическое рассуждение и супервизированные подходы к проверке утверждений. Такая интеграция позволяет проверять утверждения с большей точностью и меньшими рисками генерации нереальных выводов (генерацией "галлюцинаций"). ## Метод **CER** представляет собой инновационный подход, который включает три основных компонента: 1. **Выборка Научных Источников**: Мы используем специальные методы поиска научных статей для определения предметной области утверждения. Эти методы обеспечивают высокую точность выбора источников, чтобы гарантировать, что выводы будут опираться на доказательства. 2. **Логическое Рассуждение**: Для проверки выбранных статей мы применяем методы логического рендеринга и вывода, которые позволяют использовать тексты для глубокого понимания и вывода выводов. 3. **Проверка Утверждений**: Используя супервизированное обучение, мы обучаем модель классификации для выявления достоверности утверждений. Это позволяет системе CER не только выявлять факты, но и оценивать их точность в зависимости от качества документов и контекста. ## Результаты Мы проверили **CER** на трех высококачественных биомедицинских датасетах: **HealthFC**, **BioASQ-7b**, и **SciFact**. Конкурентные модели, такие как SciBERT и PubMedBERT, не достигли такого уровня выстраивания логических выводов и факт-чекинга. Наши результаты показали, что **CER** обеспечивает лучшую точность и генеральную сходимость в сравнении с другими подходами. Один из ключевых показателей — не только количество корректных проверенных утверждений, но и способность не генерировать недостоверные выводы, что является критическим для реальных приложений в этой области. ## Зна

Abstract

Misinformation in healthcare, from vaccine hesitancy to unproven treatments, poses risks to public health and trust in medical systems. While machine learning and natural language processing have advanced automated fact-checking, validating biomedical claims remains uniquely challenging due to complex terminology, the need for domain expertise, and the critical importance of grounding in scientific evidence. We introduce CER (Combining Evidence and Reasoning), a novel framework for biomedical fact-checking that integrates scientific evidence retrieval, reasoning via large language models, and supervised veracity prediction. By integrating the text-generation capabilities of large language models with advanced retrieval techniques for high-quality biomedical scientific evidence, CER effectively mitigates the risk of hallucinations, ensuring that generated outputs are grounded in verifiable, evidence-based sources. Evaluations on expert-annotated datasets (HealthFC, BioASQ-7b, SciFact) demonstrate state-of-the-art performance and promising cross-dataset generalization. Code and data are released for transparency and reproducibility: https: //github.com/PRAISELab-PicusLab/CER.

Ссылки и действия