Biomedical Literature Q&A System Using Retrieval-Augmented Generation (RAG)
2509.05505v1
cs.CL, cs.LG
2025-09-10
Авторы:
Mansi Garg, Lee-Chi Wang, Bhavesh Ghanchi, Sanjana Dumpala, Shreyash Kakde, Yen Chih Chen
Резюме на русском
## Контекст
Современные системы поиска информации в области медицины часто сталкиваются со сложностями в доступе к актуальной, утвержденной научной информации. Традиционные поисковые системы либо ограничиваются широкой общей информацией, либо не могут обеспечить доступ к полнотекстовым документам биомедицинской литературы. Это приводит к задержке в получении обновленных научных данных и снижению качества медицинской помощи. В этом контексте, развитие систем, которые могут эффективно обрабатывать биомедицинскую литературу и предоставлять точные ответы на вопросы, является ключевым для улучшения общего доступа к медицинской информации.
## Метод
Разработанная система основывается на архитектуре Retrieval-Augmented Generation (RAG), которая объединяет модели генеративного текста с моделями кластерного поиска для точного восстановления информации. Для восстановления используется модель MiniLM с эмбеддингами семантического поиска, адаптированной для обработки биомедицинских текстов. Выборка данных включает PubMed-статьи, специально подготовленные наборы вопросов и ответов, а также медицинские энциклопедии. Модель Mistral-7B-v0.3, тренированная с использованием QLoRA, используется для генерирования контекстуальных и точных ответов. Запросы обрабатываются в несколько этапов: в первую очередь, используется поиск векторов с использованием Faiss для выбора наиболее подходящих документов, а затем генерируется конкретный ответ на основе выбранных статей.
## Результаты
Система была оценена на задачах, связанных с биомедицинской литературой, в частности, в области рака молочной железы. Использовались метрики BERTScore (F1) для оценки точности фактической и семантической соответствия ответов. Результаты показали значительную улучшение в доступности и точности ответов по сравнению с базовыми моделями. Например, в случае с запросами по биомедицинским темам система показала более высокую точность в выборе информации и более наглядную генерацию ответов, что позволило улучшить степень доступности и понятности ответов для пользователей.
## Значимость
Система может быть применена в различных областях, включая медицинскую практику, образовательные программы и общественный доступ к научной информации. Особый потенциал имеет применение в области личностной медицинской помощи, где пользователь может получить конкретные рекомендации на основе последних научных работ. Благодаря использованию языковых моделей с низким потреблением ресурсов, система эффективна даже в условиях ограниченных ресурсов, что делает её привлекательной для развития в разных регионах. Она так
Abstract
This work presents a Biomedical Literature Question Answering (Q&A) system
based on a Retrieval-Augmented Generation (RAG) architecture, designed to
improve access to accurate, evidence-based medical information. Addressing the
shortcomings of conventional health search engines and the lag in public access
to biomedical research, the system integrates diverse sources, including PubMed
articles, curated Q&A datasets, and medical encyclopedias ,to retrieve relevant
information and generate concise, context-aware responses. The retrieval
pipeline uses MiniLM-based semantic embeddings and FAISS vector search, while
answer generation is performed by a fine-tuned Mistral-7B-v0.3 language model
optimized using QLoRA for efficient, low-resource training. The system supports
both general medical queries and domain-specific tasks, with a focused
evaluation on breast cancer literature demonstrating the value of
domain-aligned retrieval. Empirical results, measured using BERTScore (F1),
show substantial improvements in factual consistency and semantic relevance
compared to baseline models. The findings underscore the potential of
RAG-enhanced language models to bridge the gap between complex biomedical
literature and accessible public health knowledge, paving the way for future
work on multilingual adaptation, privacy-preserving inference, and personalized
medical AI systems.
Ссылки и действия
Дополнительные ресурсы: