MedKGent: A Large Language Model Agent Framework for Constructing Temporally Evolving Medical Knowledge Graph

2508.12393v1 cs.CL, cs.AI 2025-08-19
Авторы:

Duzhen Zhang, Zixiao Wang, Zhong-Zhi Li, Yahan Yu, Shuncheng Jia, Jiahua Dong, Haotian Xu, Xing Wu, Yingying Zhang, Tielin Zhang, Jie Yang, Xiuying Chen, Le Song

Резюме на русском

#### Контекст В силу быстрого роста медицинской литературы становится все сложнее обеспечить эффективную структурированность и интеграцию биомедицинских знаний. Знанийсуществующий граф (KG) представляет собой законченное решение, позволяющее эффективно выполнять поиск, автоматическое вывод и открытие новых знаний. Однако существующие методы построения графа чаще всего опираются на управляемые подходы с ограниченными возможностями общей применимости, или же грубо агрегируют выводы из Больших Моделей Языка (LLM), считая биомедицинскую литературу статичной и невзирая на временную динамику и контекстуальную неопределенность развития знаний. Чтобы решить эти проблемы, мы предлагаем MedKGent — фреймворк на основе Большой Модели Языка, предназначенный для построения временно меняющихся биомедицинских графов знаний. #### Метод MedKGent использует две специализированные агенты, основанные на модели Qwen2.5-32B-Instruct. **Extractor Agent** идентифицирует значимые троицы знаний и присваивает им базовые степени достоверности, используя выборку для оценки. Эти оценки используются для отфильтрованных низкодостоверных троиц. **Constructor Agent**, в свою очередь, добавляет полученные троицы в временно меняющийся граф, рассчитывая на вклад дат и доверительных оценок для поддержания повторяющихся знаний и разрешения конфликтов. #### Результаты Мы провели тщательные эксперименты на базе 10 миллионов абстрактов из PubMed, охватывающих период с 1975 по 2023 год. Благодаря этой модели, мы получили граф с 156,275 сущностями и 2,971,384 перестановок. Экспертное оценивание показало высокую точность (приблизительно 90%), с отличным соответствием между оценками экспертов. Мы также проверили возможности MedKGent в области медицинского QA, используя RAG на семь медицинских бенчмарков. В результате, наблюдали значительные улучшения в сравнении с базовыми моделями. #### Значимость MedKGent имеет широкое применение в медицинских графах, включая литературно-ориентированную репуризацию, доступ к знаниям и поддержку принятия решений. Он предлагает выгоды в области точности, эффективности и гибкости, открывая пути к будущим исследованиям в области развития знаний в здравоохранении. #### Выводы MedKGent является первым подходом к построению временно меняющихся биомедицинских графов с использованием Большой Модели Языка. Он доказал высокую точность и практическую ценность в медицинской литературе. Будущие работы будут сосредоточены на

Abstract

The rapid expansion of medical literature presents growing challenges for structuring and integrating domain knowledge at scale. Knowledge Graphs (KGs) offer a promising solution by enabling efficient retrieval, automated reasoning, and knowledge discovery. However, current KG construction methods often rely on supervised pipelines with limited generalizability or naively aggregate outputs from Large Language Models (LLMs), treating biomedical corpora as static and ignoring the temporal dynamics and contextual uncertainty of evolving knowledge. To address these limitations, we introduce MedKGent, a LLM agent framework for constructing temporally evolving medical KGs. Leveraging over 10 million PubMed abstracts published between 1975 and 2023, we simulate the emergence of biomedical knowledge via a fine-grained daily time series. MedKGent incrementally builds the KG in a day-by-day manner using two specialized agents powered by the Qwen2.5-32B-Instruct model. The Extractor Agent identifies knowledge triples and assigns confidence scores via sampling-based estimation, which are used to filter low-confidence extractions and inform downstream processing. The Constructor Agent incrementally integrates the retained triples into a temporally evolving graph, guided by confidence scores and timestamps to reinforce recurring knowledge and resolve conflicts. The resulting KG contains 156,275 entities and 2,971,384 relational triples. Quality assessments by two SOTA LLMs and three domain experts demonstrate an accuracy approaching 90\%, with strong inter-rater agreement. To evaluate downstream utility, we conduct RAG across seven medical question answering benchmarks using five leading LLMs, consistently observing significant improvements over non-augmented baselines. Case studies further demonstrate the KG's value in literature-based drug repurposing via confidence-aware causal inference.

Ссылки и действия