CardAIc-Agents: A Multimodal Framework with Hierarchical Adaptation for Cardiac Care Support

2508.13256v1 cs.AI, cs.CY, cs.MA 2025-08-21

Авторы:

Yuting Zhang, Karina V. Bunting, Asgher Champsi, Xiaoxia Wang, Wenqi Lu, Alexander Thorley, Sandeep S Hothi, Zhaowen Qiu, Dipak Kotecha, Jinming Duan

Резюме на русском

#### Контекст Кардиоваскулярные заболевания (СВЗ) остаются ведущей причиной смерти в мире, с тяжелым финансовым и социальным воздействием. Одной из основных причин этой проблемы является значительный дефицит квалифицированных медицинских работников. Искусственный интеллект (AI) имеет потенциал для решения этого вопроса, автоматизируя процессы эскалации, диагностики и прогнозирования. Однако существуют ряд препятствий, которые ограничивают клиническое применение AI-агентов. Эти препятствия включают: неэффективное назначение клинических ролей, опирающееся слишком много на модельные возможности без дополнительной инструментальной поддержки; статические потоки работы, не достаточно адаптивные для персонализированного подхода к кардиологическому лечению; недостаточная гибкость в обновлении знаний и ограниченность интерактивности при необходимости дополнительного обозначения; а также возможности визуального представления результатов. CardAIc-Agents было предложено для устранения этих проблем. #### Метод CardAIc-Agents представляет собой многомодальный фреймворк, который объединяет в себе несколько слоев адаптации для поддержки различных задач кардиологии. Основная компонента — CardiacRAG, которая формирует общую стратегию на основе управляемого и обновляемого базы знаний. Далее, этот план исполняется автономно с помощью подсистемы "chief agent", которая использует инструменты для выполнения специфичных задач. Для улучшения адаптивности, применяется стратегия stepwise update, позволяющая динамически обновлять планы в зависимости от результатов предыдущих этапов работы. Кроме того, для поддержки многопрофильных дискуссий, предлагается инструмент для визуального обозначения сложных случаев. В случае необходимости, предоставляется визуальный панельный интерфейс для подтверждения результатов. #### Результаты Авторы провели эксперименты на трех различных датасетах, сравнив CardAIc-Agents с основными Vision-Language Models (VLMs), современными агентными системами и моделями VLMs, настроенными на задачу. Результаты показали, что CardAIc-Agents демонстрирует высокую эффективность в сравнении с конкурентными моделями, особенно в случаях сложных задач, требующих адаптивного подхода и гибкой настройки. Эти результаты также подтвердили высокую точность и скорость работы системы при анализе комплексных многомодальных данных. #### Значимость CardAIc-Agents предлагает широкие возможности для клинического применения. Он может использоваться для прогнозирования и анализа в сочетании с персонализированными рекомендациями для пациентов. Его гибкая архитектура позволяет адаптироваться к различным ситуациям и требованиям

Abstract

Cardiovascular diseases (CVDs) remain the foremost cause of mortality worldwide, a burden worsened by a severe deficit of healthcare workers. Artificial intelligence (AI) agents have shown potential to alleviate this gap via automated early detection and proactive screening, yet their clinical application remains limited by: 1) prompt-based clinical role assignment that relies on intrinsic model capabilities without domain-specific tool support; or 2) rigid sequential workflows, whereas clinical care often requires adaptive reasoning that orders specific tests and, based on their results, guides personalised next steps; 3) general and static knowledge bases without continuous learning capability; and 4) fixed unimodal or bimodal inputs and lack of on-demand visual outputs when further clarification is needed. In response, a multimodal framework, CardAIc-Agents, was proposed to augment models with external tools and adaptively support diverse cardiac tasks. Specifically, a CardiacRAG agent generated general plans from updatable cardiac knowledge, while the chief agent integrated tools to autonomously execute these plans and deliver decisions. To enable adaptive and case-specific customization, a stepwise update strategy was proposed to dynamically refine plans based on preceding execution results, once the task was assessed as complex. In addition, a multidisciplinary discussion tool was introduced to interpret challenging cases, thereby supporting further adaptation. When clinicians raised concerns, visual review panels were provided to assist final validation. Experiments across three datasets showed the efficiency of CardAIc-Agents compared to mainstream Vision-Language Models (VLMs), state-of-the-art agentic systems, and fine-tuned VLMs.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Резюме на русском

Abstract

Ссылки и действия

Навигация