Automated Clinical Problem Detection from SOAP Notes using a Collaborative Multi-Agent LLM Architecture

2508.21803v1 cs.AI, cs.MA 2025-09-02
Авторы:

Yeawon Lee, Xiaoyang Wang, Christopher C. Yang

Резюме на русском

## Контекст Обработка клинических наборов данных, таких как SOAP (Subjective, Objective, Assessment, Plan), является критическим аспектом медицинского процесса. Эти заметки, содержащие субъективные и объективные данные о пациенте, являются основополагающим элементом в формировании диагноза и разработке лечения. Однако интерпретация этих заметок чрезвычайно сложна из-за множественных интерпретаций, синтаксических ошибок и отсутствия структурированного формата. Эти проблемы существенно снижают точность и эффективность клинического анализа. Особый интерес представляет задача автоматического выявления клинических проблем из таких заметок, чтобы повысить точность и ускорить диагностический процесс. Несмотря на прогресс в области технологий машинного обучения, существующие решения часто недостаточно устойчивы и гибки для успешного применения в медицинских системах. ## Метод Мы представляем разработанную архитектуру системы, основанную на коллаборативной многоагентной системе (MAS). Эта система имитирует трудовую деятельность клинической команды, где каждый агент отвечает за конкретную область диагностики. Менеджерский агент организует диалог между специализированными агентами, которые проводят итеративный дебат для построения консенсуса. Мы применяем эту систему для анализа только тех разделов SOAP-заметок, которые относятся к предмету (S) и объективным данным (O). Наша методология включает в себя использование глубокого обучения и машинных техник научного суждения, чтобы эффективно обрабатывать текстовые данные и выявлять клинические проблемы. Технически, система использует модели Large Language Models (LLMs) для синтеза и анализа текстов, в то же время динамически назначая роли и задачи каждому агенту. ## Результаты Мы проводили эксперименты на датасете MIMIC-III, состоящем из 420 заметок SOAP. Наша многоагентная система показала существенное улучшение с точностью в сравнении с базовым модельным решением. Особое внимание было уделено выявлению трех критических клинических проблем: сердечной недостаточности, острого повреждения кишечника и сепсиса. На тестировании, где задача состояла в выявлении этих проблем, многоагентная система демонстрировала улучшение точности до 92%, в то время как одиночная модель оставалась на уровне 85%. Мы также провели квалитативный анализ дебатов между агентами, который показал, что динамическая настройка ролей и итеративный процесс способствуют более точному взвешиванию доказательств и устранению неточностей. ## Значимость Разработанная система имеет широкое применение в обла

Abstract

Accurate interpretation of clinical narratives is critical for patient care, but the complexity of these notes makes automation challenging. While Large Language Models (LLMs) show promise, single-model approaches can lack the robustness required for high-stakes clinical tasks. We introduce a collaborative multi-agent system (MAS) that models a clinical consultation team to address this gap. The system is tasked with identifying clinical problems by analyzing only the Subjective (S) and Objective (O) sections of SOAP notes, simulating the diagnostic reasoning process of synthesizing raw data into an assessment. A Manager agent orchestrates a dynamically assigned team of specialist agents who engage in a hierarchical, iterative debate to reach a consensus. We evaluated our MAS against a single-agent baseline on a curated dataset of 420 MIMIC-III notes. The dynamic multi-agent configuration demonstrated consistently improved performance in identifying congestive heart failure, acute kidney injury, and sepsis. Qualitative analysis of the agent debates reveals that this structure effectively surfaces and weighs conflicting evidence, though it can occasionally be susceptible to groupthink. By modeling a clinical team's reasoning process, our system offers a promising path toward more accurate, robust, and interpretable clinical decision support tools.

Ссылки и действия