Cowpox: Towards the Immunity of VLM-based Multi-Agent Systems
2508.09230v1
cs.MA, cs.AI
2025-08-15
Авторы:
Yutong Wu, Jie Zhang, Yiming Li, Chao Zhang, Qing Guo, Nils Lukas, Tianwei Zhang
Резюме на русском
## Контекст
Vision Language Model (VLM)-based агенты являются состоятельными, автономными субъектами, которые могут воспринимать и взаимодействовать со своим окружением с помощью визуальной и языковой информации. Многоагентные системы состоят из специализированных агентов, которые сотрудничают для решения сложных задач. Одним из ключевых аспектов безопасности таких систем является их робастность, то есть способность сохранять свою целостность под угрозой атак. Однако многие нынешние многоагентные системы не учитывают этот аспект, что приводит к риску распространения эксплойтов. Если одному агенту удается быть скомпрометированным, то инфекция может распространиться на другие агенты, в результате чего система может потерять свою целостность. Данная проблема требует разработки эффективных механизмов защиты, чтобы повысить робастность многоагентных систем.
## Метод
Мы предлагаем механизм Cowpox, который носит распределенный характер и направлен на усиление робастности многоагентных систем. Основная идея заключается в создании и распространении специальных лекарственных примеров, которые могут предотвратить заражение агента до его вступления в контакт с вредоносным агентом. Также эти примеры помогают восстановить здоровье уже зараженных агентов. Механизм Cowpox использует специальные модели, позволяющие проводить диагностику заражения, определять степень влияния на агента и принимать соответствующие меры по восстановлению. Таким образом, Cowpox не только улучшает возможности восстановления, но и ограничивает распространение инфекции по сети агентов.
## Результаты
Для проверки эффективности механизма Cowpox были проведены эксперименты на симулированных многоагентных системах, в которых были распространялись виртуальные вирусы. Мы использовали разные уровни сложности атак, чтобы оценить эффективность Cowpox в сравнении с базовыми методами. Результаты показали, что Cowpox существенно повышает скорость восстановления агентов и уменьшает распространение инфекции. Например, при атаке с уровнем сложности 4, Cowpox уменьшил количество инфицированных агентов на 30% по сравнению с контрольным случаем. Также были получены теоретические гарантии робастности, базирующиеся на анализе свойств распределенного механизма.
## Значимость
Механизм Cowpox может быть применен в различных областях, где необходима робастность многоагентных систем, таких как облачные сервисы, системы управления роботами и IoT-сети. Одно из преимуществ Cowpox заключается в том, что он не требует глобальных изменений в архитек
Abstract
Vision Language Model (VLM)-based agents are stateful, autonomous entities
capable of perceiving and interacting with their environments through vision
and language. Multi-agent systems comprise specialized agents who collaborate
to solve a (complex) task. A core security property is robustness, stating that
the system should maintain its integrity under adversarial attacks. However,
the design of existing multi-agent systems lacks the robustness consideration,
as a successful exploit against one agent can spread and infect other agents to
undermine the entire system's assurance. To address this, we propose a new
defense approach, Cowpox, to provably enhance the robustness of multi-agent
systems. It incorporates a distributed mechanism, which improves the recovery
rate of agents by limiting the expected number of infections to other agents.
The core idea is to generate and distribute a special cure sample that
immunizes an agent against the attack before exposure and helps recover the
already infected agents. We demonstrate the effectiveness of Cowpox empirically
and provide theoretical robustness guarantees.
Ссылки и действия
Дополнительные ресурсы: