Multi-Ontology Integration with Dual-Axis Propagation for Medical Concept Representation

2508.21320v1 cs.AI, cs.LG 2025-09-02
Авторы:

Mohsen Nayebi Kerdabadi, Arya Hadizadeh Moghaddam, Dongjie Wang, Zijun Yao

Резюме на русском

## Контекст Medical ontology graphs являются важной компонентой систем обработки информации в медицине. Они связывают внешний доменный знаний с медицинскими кодами в электронных записках обо всех видах деятельности (Electronic Health Records, EHR) с помощью структурированных отношений. Используя доменно-апробированные связи (например, родитель-потомок), модели с предсказательной моделью могут генерировать более глубокие медицинские представления понятий, включая контекстные сведения от связанных понятий. Несмотря на это, существующие исследования ограничиваются использованием знаний из одной онтологии или изолированным использованием нескольких онтологий без интеграции их в единое обучающее решение. Таким образом, обучение представления понятий остается в пределах внутрионтологических связей, не обращая внимания на перекрестные связи между онтологиями. В настоящем исследовании предлагается LINKO — [подробнее о названии] — чтобы решить эту проблему и обогатить представления понятий в медицинской сфере. ## Метод LINKO представляет собой инновационную методологию для обучения представлений понятий, основывающуюся на большой модели языка (LLM) и расширенной архитектуре двойной аксиальной пропагации. Метод предлагает следующие шаги: 1. **Инициализация с помощью LLM:** Использует граф-ориентированное восстановление для инициализации очистки информации о понятиях в онтологиях. Для этого используется особенное предложение, включающее описание понятий и контекст онтологии. 2. **Двойная аксиальная пропагация:** Обучение производится через две основные оси: - **Вертикальная пропагация внутри-онтологии:** Обучение понятий в каждой онтологии по отношению к своим родительским и дочерним понятиям. - **Горизонтальная пропагация меж-онтологии:** Заполнение одного понятия в одной онтологии с помощью похожих понятий в других онтологиях. 3. **Подключение моделей EHR:** LINKO является полностью совместимой с текущими медицинскими моделями взаимодействия с электронными записками обо всех видах деятельности. ## Результаты Эксперименты проводились на двух открытых датасетах, сравнивая LINKO с состоянием технологий. Результаты показали, что LINKO превосходит базовые модели по метрикам качества, таким как F1-меру и AUC-ROC. Была проведена также эмпирическая оценка устойчивости LINKO в ситуациях с ограниченным количеством данных и на редких заболеваниях. Эти результаты демонстрируют, что LINKO предлагает существенные улучшения в представлении понятий в стохастических задачах. ## Значимость LINKO имеет широкое применение в следу

Abstract

Medical ontology graphs map external knowledge to medical codes in electronic health records via structured relationships. By leveraging domain-approved connections (e.g., parent-child), predictive models can generate richer medical concept representations by incorporating contextual information from related concepts. However, existing literature primarily focuses on incorporating domain knowledge from a single ontology system, or from multiple ontology systems (e.g., diseases, drugs, and procedures) in isolation, without integrating them into a unified learning structure. Consequently, concept representation learning often remains limited to intra-ontology relationships, overlooking cross-ontology connections. In this paper, we propose LINKO, a large language model (LLM)-augmented integrative ontology learning framework that leverages multiple ontology graphs simultaneously by enabling dual-axis knowledge propagation both within and across heterogeneous ontology systems to enhance medical concept representation learning. Specifically, LINKO first employs LLMs to provide a graph-retrieval-augmented initialization for ontology concept embedding, through an engineered prompt that includes concept descriptions, and is further augmented with ontology context. Second, our method jointly learns the medical concepts in diverse ontology graphs by performing knowledge propagation in two axes: (1) intra-ontology vertical propagation across hierarchical ontology levels and (2) inter-ontology horizontal propagation within every level in parallel. Last, through extensive experiments on two public datasets, we validate the superior performance of LINKO over state-of-the-art baselines. As a plug-in encoder compatible with existing EHR predictive models, LINKO further demonstrates enhanced robustness in scenarios involving limited data availability and rare disease prediction.

Ссылки и действия