Combining Evidence and Reasoning for Biomedical Fact-Checking
2509.13879v1
cs.CL, cs.AI, cs.IR
2025-09-19
Авторы:
Mariano Barone, Antonio Romano, Giuseppe Riccio, Marco Postiglione, Vincenzo Moscato
Резюме на русском
Да
## Контекст
Загруженность медицинских систем и внезапное возвращение многих заболеваний приводят к углубленному интересу к улучшению методов защиты организма. Одна из самых серьезных проблем в этой области является биомедицинское факт-чекинг, которое способствует улучшению общественного наблюдения за осведомленностью о здравоохранении и доверию к медицинским отделениям. Несмотря на то, что современные технологии машинного обучения и естественного языкового обработки позволяют автоматизировать часть процесса факт-чекинга, эта область остается недостаточно развитой из-за трудностей с верификацией биомедицинских утверждений. Эти утверждения часто имеют сложную терминологию, требуют специализированного знания, и требуют тщательной верификации на основе научных источников. Мы предлагаем **CER** (Combining Evidence and Reasoning), новую систему, которая активно интегрирует основные научные статьи, логическое рассуждение и супервизированные подходы к проверке утверждений. Такая интеграция позволяет проверять утверждения с большей точностью и меньшими рисками генерации нереальных выводов (генерацией "галлюцинаций").
## Метод
**CER** представляет собой инновационный подход, который включает три основных компонента:
1. **Выборка Научных Источников**: Мы используем специальные методы поиска научных статей для определения предметной области утверждения. Эти методы обеспечивают высокую точность выбора источников, чтобы гарантировать, что выводы будут опираться на доказательства.
2. **Логическое Рассуждение**: Для проверки выбранных статей мы применяем методы логического рендеринга и вывода, которые позволяют использовать тексты для глубокого понимания и вывода выводов.
3. **Проверка Утверждений**: Используя супервизированное обучение, мы обучаем модель классификации для выявления достоверности утверждений. Это позволяет системе CER не только выявлять факты, но и оценивать их точность в зависимости от качества документов и контекста.
## Результаты
Мы проверили **CER** на трех высококачественных биомедицинских датасетах: **HealthFC**, **BioASQ-7b**, и **SciFact**. Конкурентные модели, такие как SciBERT и PubMedBERT, не достигли такого уровня выстраивания логических выводов и факт-чекинга. Наши результаты показали, что **CER** обеспечивает лучшую точность и генеральную сходимость в сравнении с другими подходами. Один из ключевых показателей — не только количество корректных проверенных утверждений, но и способность не генерировать недостоверные выводы, что является критическим для реальных приложений в этой области.
## Зна
Abstract
Misinformation in healthcare, from vaccine hesitancy to unproven treatments,
poses risks to public health and trust in medical systems. While machine
learning and natural language processing have advanced automated fact-checking,
validating biomedical claims remains uniquely challenging due to complex
terminology, the need for domain expertise, and the critical importance of
grounding in scientific evidence. We introduce CER (Combining Evidence and
Reasoning), a novel framework for biomedical fact-checking that integrates
scientific evidence retrieval, reasoning via large language models, and
supervised veracity prediction. By integrating the text-generation capabilities
of large language models with advanced retrieval techniques for high-quality
biomedical scientific evidence, CER effectively mitigates the risk of
hallucinations, ensuring that generated outputs are grounded in verifiable,
evidence-based sources. Evaluations on expert-annotated datasets (HealthFC,
BioASQ-7b, SciFact) demonstrate state-of-the-art performance and promising
cross-dataset generalization. Code and data are released for transparency and
reproducibility: https: //github.com/PRAISELab-PicusLab/CER.
Ссылки и действия
Дополнительные ресурсы: