CardAIc-Agents: A Multimodal Framework with Hierarchical Adaptation for Cardiac Care Support
2508.13256v1
cs.AI, cs.CY, cs.MA
2025-08-21
Авторы:
Yuting Zhang, Karina V. Bunting, Asgher Champsi, Xiaoxia Wang, Wenqi Lu, Alexander Thorley, Sandeep S Hothi, Zhaowen Qiu, Dipak Kotecha, Jinming Duan
Резюме на русском
#### Контекст
Кардиоваскулярные заболевания (СВЗ) остаются ведущей причиной смерти в мире, с тяжелым финансовым и социальным воздействием. Одной из основных причин этой проблемы является значительный дефицит квалифицированных медицинских работников. Искусственный интеллект (AI) имеет потенциал для решения этого вопроса, автоматизируя процессы эскалации, диагностики и прогнозирования. Однако существуют ряд препятствий, которые ограничивают клиническое применение AI-агентов. Эти препятствия включают: неэффективное назначение клинических ролей, опирающееся слишком много на модельные возможности без дополнительной инструментальной поддержки; статические потоки работы, не достаточно адаптивные для персонализированного подхода к кардиологическому лечению; недостаточная гибкость в обновлении знаний и ограниченность интерактивности при необходимости дополнительного обозначения; а также возможности визуального представления результатов. CardAIc-Agents было предложено для устранения этих проблем.
#### Метод
CardAIc-Agents представляет собой многомодальный фреймворк, который объединяет в себе несколько слоев адаптации для поддержки различных задач кардиологии. Основная компонента — CardiacRAG, которая формирует общую стратегию на основе управляемого и обновляемого базы знаний. Далее, этот план исполняется автономно с помощью подсистемы "chief agent", которая использует инструменты для выполнения специфичных задач. Для улучшения адаптивности, применяется стратегия stepwise update, позволяющая динамически обновлять планы в зависимости от результатов предыдущих этапов работы. Кроме того, для поддержки многопрофильных дискуссий, предлагается инструмент для визуального обозначения сложных случаев. В случае необходимости, предоставляется визуальный панельный интерфейс для подтверждения результатов.
#### Результаты
Авторы провели эксперименты на трех различных датасетах, сравнив CardAIc-Agents с основными Vision-Language Models (VLMs), современными агентными системами и моделями VLMs, настроенными на задачу. Результаты показали, что CardAIc-Agents демонстрирует высокую эффективность в сравнении с конкурентными моделями, особенно в случаях сложных задач, требующих адаптивного подхода и гибкой настройки. Эти результаты также подтвердили высокую точность и скорость работы системы при анализе комплексных многомодальных данных.
#### Значимость
CardAIc-Agents предлагает широкие возможности для клинического применения. Он может использоваться для прогнозирования и анализа в сочетании с персонализированными рекомендациями для пациентов. Его гибкая архитектура позволяет адаптироваться к различным ситуациям и требованиям
Abstract
Cardiovascular diseases (CVDs) remain the foremost cause of mortality
worldwide, a burden worsened by a severe deficit of healthcare workers.
Artificial intelligence (AI) agents have shown potential to alleviate this gap
via automated early detection and proactive screening, yet their clinical
application remains limited by: 1) prompt-based clinical role assignment that
relies on intrinsic model capabilities without domain-specific tool support; or
2) rigid sequential workflows, whereas clinical care often requires adaptive
reasoning that orders specific tests and, based on their results, guides
personalised next steps; 3) general and static knowledge bases without
continuous learning capability; and 4) fixed unimodal or bimodal inputs and
lack of on-demand visual outputs when further clarification is needed. In
response, a multimodal framework, CardAIc-Agents, was proposed to augment
models with external tools and adaptively support diverse cardiac tasks.
Specifically, a CardiacRAG agent generated general plans from updatable cardiac
knowledge, while the chief agent integrated tools to autonomously execute these
plans and deliver decisions. To enable adaptive and case-specific
customization, a stepwise update strategy was proposed to dynamically refine
plans based on preceding execution results, once the task was assessed as
complex. In addition, a multidisciplinary discussion tool was introduced to
interpret challenging cases, thereby supporting further adaptation. When
clinicians raised concerns, visual review panels were provided to assist final
validation. Experiments across three datasets showed the efficiency of
CardAIc-Agents compared to mainstream Vision-Language Models (VLMs),
state-of-the-art agentic systems, and fine-tuned VLMs.
Ссылки и действия
Дополнительные ресурсы: