MedKGent: A Large Language Model Agent Framework for Constructing Temporally Evolving Medical Knowledge Graph

2508.12393v2 cs.CL, cs.AI 2025-08-20
Авторы:

Duzhen Zhang, Zixiao Wang, Zhong-Zhi Li, Yahan Yu, Shuncheng Jia, Jiahua Dong, Haotian Xu, Xing Wu, Yingying Zhang, Tielin Zhang, Jie Yang, Xiuying Chen, Le Song

Резюме на русском

## Контекст В последние десятилетия рост объема медицинской литературы представляет собой серьезную проблему для поиска, структурирования и интеграции биомедицинских знаний. Одним из продвинутых подходов является использование знаний в форме графов (Knowledge Graphs, KGs), которые эффективно поддерживают автоматическое обобщение, восстановление информации и выявление знаний. Однако, существующие методы строительства KGs либо ограничены в области применения, либо используют широкомасштабный шанс от LLMs, не учитывая динамику знаний во времени и контекстное неопределенность. Для решения этих проблем предлагается MedKGent, новый фреймворк на основе LLMs для построения динамически изменяющихся KGs в медицинской области. Он основывается на более 10 миллионов абстрактов PubMed, начиная с 1975 года и до 2023 года, и строится при помощи двух специальных агентов, работающих на модели Qwen2.5-32B-Instruct. ## Метод MedKGent использует два основных агента для построения KG. **Extractor Agent** распознает знания в виде троек (субъект-предикат-объект) из текста и присваивает им доверительные оценки с помощью семплирования. Эти оценки используются для исключения низкого-доверительных элементов и для улучшения последующих этапов. **Constructor Agent** принимает доверительные тройки, сортирует их в соответствии с их временными метками и вносит в граф, в то же время разрешая конфликты и укрепляя стабильные знания. Эта последовательность позволяет MedKGent эффективно реагировать на динамические изменения в медицинской литературе, а также обеспечивать высокое качество и точность. ## Результаты Используя 10 миллионов абстрактов, MedKGent построил KG, содержащий 156,275 сущностей и 2,971,384 реляций. Тесты показали, что точность достигает 90% при оценке двумя SOTA LLMs и тремя экспертами в области. Эксперименты по расширенному рассуждению (Retrieval-Augmented Generation, RAG) показали, что MedKGent улучшает результаты на несколько бенчмарок, сравниваясь с лидирующими LLMs. Например, в случае использования в клиническом репутиринге, семплирование доверительных связей позволило увеличить точность инференции. ## Значимость MedKGent предлагает средство для эффективного строительства KGs, которые не только включают статические знания, но и учитывают временную динамику и контекст. Это может быть применено в сферах, таких как клинические решения, лекарственное репутиринг и образование в медицине. Избегая проблем статических KGs, MedKGent предоставляет динамическую модель знаний, усиливая уверенность в выводах и обеспечивая лучшую точность. ## Выводы

Abstract

The rapid expansion of medical literature presents growing challenges for structuring and integrating domain knowledge at scale. Knowledge Graphs (KGs) offer a promising solution by enabling efficient retrieval, automated reasoning, and knowledge discovery. However, current KG construction methods often rely on supervised pipelines with limited generalizability or naively aggregate outputs from Large Language Models (LLMs), treating biomedical corpora as static and ignoring the temporal dynamics and contextual uncertainty of evolving knowledge. To address these limitations, we introduce MedKGent, a LLM agent framework for constructing temporally evolving medical KGs. Leveraging over 10 million PubMed abstracts published between 1975 and 2023, we simulate the emergence of biomedical knowledge via a fine-grained daily time series. MedKGent incrementally builds the KG in a day-by-day manner using two specialized agents powered by the Qwen2.5-32B-Instruct model. The Extractor Agent identifies knowledge triples and assigns confidence scores via sampling-based estimation, which are used to filter low-confidence extractions and inform downstream processing. The Constructor Agent incrementally integrates the retained triples into a temporally evolving graph, guided by confidence scores and timestamps to reinforce recurring knowledge and resolve conflicts. The resulting KG contains 156,275 entities and 2,971,384 relational triples. Quality assessments by two SOTA LLMs and three domain experts demonstrate an accuracy approaching 90%, with strong inter-rater agreement. To evaluate downstream utility, we conduct RAG across seven medical question answering benchmarks using five leading LLMs, consistently observing significant improvements over non-augmented baselines. Case studies further demonstrate the KG's value in literature-based drug repurposing via confidence-aware causal inference.

Ссылки и действия