From MAS to MARS: Coordination Failures and Reasoning Trade-offs in Hierarchical Multi-Agent Robotic Systems within a Healthcare Scenario

2508.04691v1 cs.RO, cs.AI, cs.MA 2025-08-08
Авторы:

Yuanchen Bai, Zijian Ding, Shaoyue Wen, Xiang Chang, Angelique Taylor

Резюме на русском

## КОНТЕКСТ И ПРОБЛЕМАТИКА Область многоагентных робототехнических систем (MARS) представляет собой естественное развитие традиционных многоагентных систем (MAS), дополненное физическими ограничениями и задачами реального мира. В отличие от чисто программных агентов, роботы-агенты должны учитывать пространственные ограничения, физические взаимодействия с окружающей средой и ограничения аппаратного обеспечения. Это значительно усложняет процесс координации и выполнения действий, превращая абстрактные алгоритмы в конкретные физические операции. Healthcare-сектор становится особенно перспективным для внедрения MARS, поскольку медицинские учреждения сталкиваются с растущими нагрузками и потребностью в автоматизации рутинных процессов. Однако несмотря на наличие продвинутых многоагентных фреймворков, их реальное развертывание на роботах остается ограниченным. Это создает значительный разрыв между теоретическими разработками и практическим применением. Ключевые проблемы, мешающие внедрению, включают: невозможность заранее предсказать все возможные сценарии взаимодействия агентов, сложность обработки реальных отказов оборудования, необходимость обеспечения безопасности пациентов и персонала, а также проблему масштабируемости при увеличении количества роботов. Традиционные подходы, основанные на предоставлении контекстных знаний, часто оказываются недостаточными для решения координационных сбоев, возникающих в динамичной реальной среде. Авторы статьи фокусируются на иерархических многоагентных фреймворках, которые обещают более эффективную координацию за счет структурирования взаимодействий между агентами. Особое внимание уделяется изучению компромиссов между различными уровнями автономности агентов и общей стабильностью системы, что критически важно для обеспечения надежности в медицинских приложениях. ## ПРЕДЛОЖЕННЫЙ МЕТОД Исследование проводится в два этапа с использованием двух различных фреймворков для многоагентных систем: CrewAI и AutoGen. Первый этап (Study 1) сосредоточен на систематическом выявлении и категоризации координационных сбоев с помощью CrewAI, в то время как второй этап (Study 2) оценивает переработанную структуру двунаправленной коммуникации с использованием AutoGen. В Study 1 применяется итеративный подход к уточнению базы знаний системы. Процесс включает многократные циклы тестирования, где после каждого обнаруженного сбоя в базу знаний добавляются новые контекстные данные. Это позволяет выявить типы координационных сбоев, которые не могут быть решены только путем предоставления дополнительного контекста. Основные категории сбоев включают: нарушения доступа к инструментам (tool access violations), несвоевременную обработку отчетов об ошибках, конфликты при доступе к общим ресурсам и проблемы с приоритизацией задач. Study 2 вводит переработанную архитектуру двунаправленной коммуникации между агентами, где каждый агент может инициировать коммуникацию и получать обратную связь от других агентов. Это противопоставляется традиционной иерархической модели, где коммуникация происходит преимущественно сверху вниз. Кроме того, исследуется влияние использования моделей с различными способностями к рассуждению: одни агенты оснащены продвинутыми возможностями логического вывода, в то время как другие опираются на более простые шаблонные реакции. Экспериментальная среда моделирует реальное медицинское учреждение с множеством роботов, выполняющих различные задачи: доставка медикаментов, сопровождение пациентов, уборка помещений и техническое обслуживание оборудования. Система включает в себя физические ограничения, такие как ограниченное пространство, приоритеты доступа к ресурсам и возможные отказы оборудования. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ В рамках Study 1 было проведено более 200 итераций тестирования с CrewAI, что позволило выявить 47 уникальных сценариев координационных сбоев. Классификация этих сбоев выявила четыре основные категории: 38% сбоев связаны с нарушениями доступа к инструментам и оборудованию, 27% - с несвоевременной обработкой отчетов об ошибках, 21% - с

Abstract

Multi-agent robotic systems (MARS) build upon multi-agent systems by integrating physical and task-related constraints, increasing the complexity of action execution and agent coordination. However, despite the availability of advanced multi-agent frameworks, their real-world deployment on robots remains limited, hindering the advancement of MARS research in practice. To bridge this gap, we conducted two studies to investigate performance trade-offs of hierarchical multi-agent frameworks in a simulated real-world multi-robot healthcare scenario. In Study 1, using CrewAI, we iteratively refine the system's knowledge base, to systematically identify and categorize coordination failures (e.g., tool access violations, lack of timely handling of failure reports) not resolvable by providing contextual knowledge alone. In Study 2, using AutoGen, we evaluate a redesigned bidirectional communication structure and further measure the trade-offs between reasoning and non-reasoning models operating within the same robotic team setting. Drawing from our empirical findings, we emphasize the tension between autonomy and stability and the importance of edge-case testing to improve system reliability and safety for future real-world deployment. Supplementary materials, including codes, task agent setup, trace outputs, and annotated examples of coordination failures and reasoning behaviors, are available at: https://byc-sophie.github.io/mas-to-mars/.

Ссылки и действия