MedKGent: A Large Language Model Agent Framework for Constructing Temporally Evolving Medical Knowledge Graph
2508.12393v1
cs.CL, cs.AI
2025-08-19
Авторы:
Duzhen Zhang, Zixiao Wang, Zhong-Zhi Li, Yahan Yu, Shuncheng Jia, Jiahua Dong, Haotian Xu, Xing Wu, Yingying Zhang, Tielin Zhang, Jie Yang, Xiuying Chen, Le Song
Резюме на русском
#### Контекст
В силу быстрого роста медицинской литературы становится все сложнее обеспечить эффективную структурированность и интеграцию биомедицинских знаний. Знанийсуществующий граф (KG) представляет собой законченное решение, позволяющее эффективно выполнять поиск, автоматическое вывод и открытие новых знаний.
Однако существующие методы построения графа чаще всего опираются на управляемые подходы с ограниченными возможностями общей применимости, или же грубо агрегируют выводы из Больших Моделей Языка (LLM), считая биомедицинскую литературу статичной и невзирая на временную динамику и контекстуальную неопределенность развития знаний.
Чтобы решить эти проблемы, мы предлагаем MedKGent — фреймворк на основе Большой Модели Языка, предназначенный для построения временно меняющихся биомедицинских графов знаний.
#### Метод
MedKGent использует две специализированные агенты, основанные на модели Qwen2.5-32B-Instruct. **Extractor Agent** идентифицирует значимые троицы знаний и присваивает им базовые степени достоверности, используя выборку для оценки. Эти оценки используются для отфильтрованных низкодостоверных троиц. **Constructor Agent**, в свою очередь, добавляет полученные троицы в временно меняющийся граф, рассчитывая на вклад дат и доверительных оценок для поддержания повторяющихся знаний и разрешения конфликтов.
#### Результаты
Мы провели тщательные эксперименты на базе 10 миллионов абстрактов из PubMed, охватывающих период с 1975 по 2023 год. Благодаря этой модели, мы получили граф с 156,275 сущностями и 2,971,384 перестановок. Экспертное оценивание показало высокую точность (приблизительно 90%), с отличным соответствием между оценками экспертов. Мы также проверили возможности MedKGent в области медицинского QA, используя RAG на семь медицинских бенчмарков. В результате, наблюдали значительные улучшения в сравнении с базовыми моделями.
#### Значимость
MedKGent имеет широкое применение в медицинских графах, включая литературно-ориентированную репуризацию, доступ к знаниям и поддержку принятия решений. Он предлагает выгоды в области точности, эффективности и гибкости, открывая пути к будущим исследованиям в области развития знаний в здравоохранении.
#### Выводы
MedKGent является первым подходом к построению временно меняющихся биомедицинских графов с использованием Большой Модели Языка. Он доказал высокую точность и практическую ценность в медицинской литературе. Будущие работы будут сосредоточены на
Abstract
The rapid expansion of medical literature presents growing challenges for
structuring and integrating domain knowledge at scale. Knowledge Graphs (KGs)
offer a promising solution by enabling efficient retrieval, automated
reasoning, and knowledge discovery. However, current KG construction methods
often rely on supervised pipelines with limited generalizability or naively
aggregate outputs from Large Language Models (LLMs), treating biomedical
corpora as static and ignoring the temporal dynamics and contextual uncertainty
of evolving knowledge. To address these limitations, we introduce MedKGent, a
LLM agent framework for constructing temporally evolving medical KGs.
Leveraging over 10 million PubMed abstracts published between 1975 and 2023, we
simulate the emergence of biomedical knowledge via a fine-grained daily time
series. MedKGent incrementally builds the KG in a day-by-day manner using two
specialized agents powered by the Qwen2.5-32B-Instruct model. The Extractor
Agent identifies knowledge triples and assigns confidence scores via
sampling-based estimation, which are used to filter low-confidence extractions
and inform downstream processing. The Constructor Agent incrementally
integrates the retained triples into a temporally evolving graph, guided by
confidence scores and timestamps to reinforce recurring knowledge and resolve
conflicts. The resulting KG contains 156,275 entities and 2,971,384 relational
triples. Quality assessments by two SOTA LLMs and three domain experts
demonstrate an accuracy approaching 90\%, with strong inter-rater agreement. To
evaluate downstream utility, we conduct RAG across seven medical question
answering benchmarks using five leading LLMs, consistently observing
significant improvements over non-augmented baselines. Case studies further
demonstrate the KG's value in literature-based drug repurposing via
confidence-aware causal inference.
Ссылки и действия
Дополнительные ресурсы: