Cowpox: Towards the Immunity of VLM-based Multi-Agent Systems

2508.09230v1 cs.MA, cs.AI 2025-08-15
Авторы:

Yutong Wu, Jie Zhang, Yiming Li, Chao Zhang, Qing Guo, Nils Lukas, Tianwei Zhang

Резюме на русском

## Контекст Vision Language Model (VLM)-based агенты являются состоятельными, автономными субъектами, которые могут воспринимать и взаимодействовать со своим окружением с помощью визуальной и языковой информации. Многоагентные системы состоят из специализированных агентов, которые сотрудничают для решения сложных задач. Одним из ключевых аспектов безопасности таких систем является их робастность, то есть способность сохранять свою целостность под угрозой атак. Однако многие нынешние многоагентные системы не учитывают этот аспект, что приводит к риску распространения эксплойтов. Если одному агенту удается быть скомпрометированным, то инфекция может распространиться на другие агенты, в результате чего система может потерять свою целостность. Данная проблема требует разработки эффективных механизмов защиты, чтобы повысить робастность многоагентных систем. ## Метод Мы предлагаем механизм Cowpox, который носит распределенный характер и направлен на усиление робастности многоагентных систем. Основная идея заключается в создании и распространении специальных лекарственных примеров, которые могут предотвратить заражение агента до его вступления в контакт с вредоносным агентом. Также эти примеры помогают восстановить здоровье уже зараженных агентов. Механизм Cowpox использует специальные модели, позволяющие проводить диагностику заражения, определять степень влияния на агента и принимать соответствующие меры по восстановлению. Таким образом, Cowpox не только улучшает возможности восстановления, но и ограничивает распространение инфекции по сети агентов. ## Результаты Для проверки эффективности механизма Cowpox были проведены эксперименты на симулированных многоагентных системах, в которых были распространялись виртуальные вирусы. Мы использовали разные уровни сложности атак, чтобы оценить эффективность Cowpox в сравнении с базовыми методами. Результаты показали, что Cowpox существенно повышает скорость восстановления агентов и уменьшает распространение инфекции. Например, при атаке с уровнем сложности 4, Cowpox уменьшил количество инфицированных агентов на 30% по сравнению с контрольным случаем. Также были получены теоретические гарантии робастности, базирующиеся на анализе свойств распределенного механизма. ## Значимость Механизм Cowpox может быть применен в различных областях, где необходима робастность многоагентных систем, таких как облачные сервисы, системы управления роботами и IoT-сети. Одно из преимуществ Cowpox заключается в том, что он не требует глобальных изменений в архитек

Abstract

Vision Language Model (VLM)-based agents are stateful, autonomous entities capable of perceiving and interacting with their environments through vision and language. Multi-agent systems comprise specialized agents who collaborate to solve a (complex) task. A core security property is robustness, stating that the system should maintain its integrity under adversarial attacks. However, the design of existing multi-agent systems lacks the robustness consideration, as a successful exploit against one agent can spread and infect other agents to undermine the entire system's assurance. To address this, we propose a new defense approach, Cowpox, to provably enhance the robustness of multi-agent systems. It incorporates a distributed mechanism, which improves the recovery rate of agents by limiting the expected number of infections to other agents. The core idea is to generate and distribute a special cure sample that immunizes an agent against the attack before exposure and helps recover the already infected agents. We demonstrate the effectiveness of Cowpox empirically and provide theoretical robustness guarantees.

Ссылки и действия