Organ-Agents: Virtual Human Physiology Simulator via LLMs

2508.14357v1 cs.LG, cs.AI, cs.CV 2025-08-22
Авторы:

Rihao Chang, He Jiao, Weizhi Nie, Honglin Guo, Keliang Xie, Zhenhua Wu, Lina Zhao, Yunpeng Bai, Yongtao Ma, Lanjun Wang, Yuting Su, Xi Gao, Weijie Wang, Nicu Sebe, Bruno Lepri, Bingwei Sun

Резюме на русском

#### Контекст Прогресс в области больших языковых моделей (LLMs) открыл новые возможности для моделирования сложных физиологических систем. Однако существуют проблемы в точности, эффективности и воспроизводимости таких моделей, особенно при анализе многосистемных феноменов. Эти ограничения приводят к затруднению использования таких моделей в клинических решениях, таких как моделирование органов, симуляция терапии и выявление патологичных процессов. Данные проблемы мотивируют развитие моделей, которые обеспечат высокую точность, универсальность и возможность проведения интерпретируемых экспериментов в критической медицинской практике. #### Метод Мы предлагаем Organ-Agents — распределенную систему, основанную на multi-agent framework, где каждый agent представляет собой отдельную систему органа (например, сердечно-сосудистая, печеночная и т.д.). Модели реализуются на базе LLMs и тренируются с помощью наборов данных системных временных рядов, полученных из реальных клинических источников. Методология включает в себя предобучение на тренировочных данных (supervised fine-tuning), а затем улучшение поведения во время работы с помощью reinforcement-guided coordination. Данная стратегия позволяет координировать агенты динамически, применяя ошибочное исправление и выбор динамических спецификаций. Наши данные включают анонимные данные 7,134 пациентов с сепсисом и 7,895 контрольных случаев, покрывающие 9 систем органов и 125 переменных. #### Результаты Мы проводили тщательную оценку Organ-Agents на 4,509 отложенных пациентов, получив высокую точность с показателями MSE <0.16 для каждой системы. Для внешней валидации использовались данные 22,689 пациентов с критической ситуацией, собранных в двух клинических центрах. Мы обнаружили небольшую задержку в поведении модели при распространении различных данных, при этом уровень точности оставался высоким. Особое внимание уделено воспроизведению критических многосистемных событий, таких как гипотензия и гипоксия, с точностью во временной и фазовой прогрессии. Мы также провели сотрудничество с 15 критических заболеваний специалистов, которые оценили модели по интерпретируемости и физиологической достоверности (средние оценки 3.9 и 3.7 в шкале Likert). Наконец, Organ-Agents позволяет проводить анализ историй болезни в условиях альтернативных стратегий терапии, позволяя прогнозировать показатели здоровья и APACHE II. #### Значимость Предложенная модель может применяться в критической медицине для моделирования органов, симуляции терапии и тестирования гипотез. Она обеспечивает высокую точность воспроизведения физиологических про

Abstract

Recent advances in large language models (LLMs) have enabled new possibilities in simulating complex physiological systems. We introduce Organ-Agents, a multi-agent framework that simulates human physiology via LLM-driven agents. Each Simulator models a specific system (e.g., cardiovascular, renal, immune). Training consists of supervised fine-tuning on system-specific time-series data, followed by reinforcement-guided coordination using dynamic reference selection and error correction. We curated data from 7,134 sepsis patients and 7,895 controls, generating high-resolution trajectories across 9 systems and 125 variables. Organ-Agents achieved high simulation accuracy on 4,509 held-out patients, with per-system MSEs <0.16 and robustness across SOFA-based severity strata. External validation on 22,689 ICU patients from two hospitals showed moderate degradation under distribution shifts with stable simulation. Organ-Agents faithfully reproduces critical multi-system events (e.g., hypotension, hyperlactatemia, hypoxemia) with coherent timing and phase progression. Evaluation by 15 critical care physicians confirmed realism and physiological plausibility (mean Likert ratings 3.9 and 3.7). Organ-Agents also enables counterfactual simulations under alternative sepsis treatment strategies, generating trajectories and APACHE II scores aligned with matched real-world patients. In downstream early warning tasks, classifiers trained on synthetic data showed minimal AUROC drops (<0.04), indicating preserved decision-relevant patterns. These results position Organ-Agents as a credible, interpretable, and generalizable digital twin for precision diagnosis, treatment simulation, and hypothesis testing in critical care.

Ссылки и действия