📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Cowpox: Towards the Immunity of VLM-based Multi-Agent Systems

2025-08-15

Авторы:

Yutong Wu, Jie Zhang, Yiming Li, Chao Zhang, Qing Guo, Nils Lukas, Tianwei Zhang

## Контекст Vision Language Model (VLM)-based агенты являются состоятельными, автономными субъектами, которые могут воспринимать и взаимодействовать со своим окружением с помощью визуальной и языковой информации. Многоагентные системы состоят из специализированных агентов, которые сотрудничают для решения сложных задач. Одним из ключевых аспектов безопасности таких систем является их робастность, то есть способность сохранять свою целостность под угрозой атак. Однако многие нынешние многоагентные системы не учитывают этот аспект, что приводит к риску распространения эксплойтов. Если одному агенту удается быть скомпрометированным, то инфекция может распространиться на другие агенты, в результате чего система может потерять свою целостность. Данная проблема требует разработки эффективных механизмов защиты, чтобы повысить робастность многоагентных систем. ## Метод Мы предлагаем механизм Cowpox, который носит распределенный характер и направлен на усиление робастности многоагентных систем. Основная идея заключается в создании и распространении специальных лекарственных примеров, которые могут предотвратить заражение агента до его вступления в контакт с вредоносным агентом. Также эти примеры помогают восстановить здоровье уже зараженных агентов. Механизм Cowpox использует специальные модели, позволяющие проводить диагностику заражения, определять степень влияния на агента и принимать соответствующие меры по восстановлению. Таким образом, Cowpox не только улучшает возможности восстановления, но и ограничивает распространение инфекции по сети агентов. ## Результаты Для проверки эффективности механизма Cowpox были проведены эксперименты на симулированных многоагентных системах, в которых были распространялись виртуальные вирусы. Мы использовали разные уровни сложности атак, чтобы оценить эффективность Cowpox в сравнении с базовыми методами. Результаты показали, что Cowpox существенно повышает скорость восстановления агентов и уменьшает распространение инфекции. Например, при атаке с уровнем сложности 4, Cowpox уменьшил количество инфицированных агентов на 30% по сравнению с контрольным случаем. Также были получены теоретические гарантии робастности, базирующиеся на анализе свойств распределенного механизма. ## Значимость Механизм Cowpox может быть применен в различных областях, где необходима робастность многоагентных систем, таких как облачные сервисы, системы управления роботами и IoT-сети. Одно из преимуществ Cowpox заключается в том, что он не требует глобальных изменений в архитек

Annotation:

Vision Language Model (VLM)-based agents are stateful, autonomous entities capable of perceiving and interacting with their environments through vision and language. Multi-agent systems comprise specialized agents who collaborate to solve a (complex) task. A core security property is robustness, stating that the system should maintain its integrity under adversarial attacks. However, the design of existing multi-agent systems lacks the robustness consideration, as a successful exploit against on...

ID: 2508.09230v1 cs.MA, cs.AI

arXiv PDF

📄 Retrieval-Augmented Multi-Agent System for Rapid Statement of Work Generation

2025-08-13

Авторы:

Amulya Suravarjhula, Rashi Chandrashekhar Agrawal, Sakshi Jayesh Patel, Rahul Gupta

## Контекст Творение Statement of Work (SOW) является ключевым элементом проектов бизнеса и правовых дел. Он устанавливает границы, описывает доставленные результаты, конкретные сроки, обязанности участников и юридические условия. Однако создание данного документа требует большого времени, требует участия многих лиц, может занимать несколько дней и сопряжено с риском ошибок или несоответствия нынешним требованиям. Эта проблема становится особенно релевантной при работе в строгановой среде. Данное исследование предлагает систему автоматизации, основанную на искусственном интеллекте, которая ускоряет, упрощает и повышает точность процесса создания SOW. ## Метод Разработанная система основывается на структуре тройного агентного метода. Первый агент создает начальный вариант SOW, аккордируясь с заданными данными и требованиями проекта. Второй агент осуществляет проверку соответствия юридическим и формальным требованиям. Третий агент занимается форматированием и корректировкой. Данная система отличается от стандартных онлайн-инструментов, которые лишь вставляют данные в шаблоны. Вместо этого, система понимает смысловую нагрузку документа и применяет специальные решения для оптимизации содержания и форматирования. ## Результаты Исследования были проведены на реальных данных, включающих несколько бизнес-сценариев. Для создания SOW требовалось всего три минуты, что значительно сокращает время в сравнении с традиционными методами (несколько часов или дней). Также проверена точность результатов, и они были соответствующими стандартам, что подтверждает качество и надежность системы. ## Значимость Эта система может применяться в различных сферах, где требуется надёжный и быстрый документооборот, включая юридические и бизнес-проекты. Основные преимущества: высокая скорость, сокращение риска ошибок, соответствие нормам и улучшенная удобность для пользователей. В будущем, это может привести к увеличению эффективности процессов, снижению затрат и повышению уровня доверия к автоматизированным системам в сфере юриспруденции. ## Выводы Результаты демонстрируют возможность использования искусственного интеллекта для ускорения и улучшения процесса создания SOW. Будущие исследования будут направлены на усовершенствование системы, включая увеличение гибкости и уменьшение ресурсозатрат на поддержку. Эта работа показывает направление развития ИИ в юридических и бизнес-процессах, способствуя их упрощению и автоматизации.

Annotation:

Drafting a Statement of Work (SOW) is a vital part of business and legal projects. It outlines key details like deliverables, timelines, responsibilities, and legal terms. However, creating these documents is often a slow and complex process. It usually involves multiple people, takes several days, and leaves room for errors or outdated content. This paper introduces a new AI-driven automation system that makes the entire SOW drafting process faster, easier, and more accurate. Instead of relying...

ID: 2508.07569v1 cs.MA, cs.AI

arXiv PDF

📄 Semantic Reasoning Meets Numerical Precision: An LLM-Powered Multi-Agent System for Power Grid Control

2025-08-12

Авторы:

Yan Zhang

#### Контекст Современные энергетические сети становятся все более сложными в условиях всестороннего внедрения распределенных энергетических ресурсов (DERs), широкого распространения электромобилей и увеличения частоты экстремальных метеорологических явлений. Эти факторы приводят к усилению требований к управлению и контролю гридов, которым традиционные регуляторные и оптимизационные системы не могут полностью соответствовать. Недостаток в скорости реакции, адаптивности и масштабируемости приводит к возрастающему интересу к использованию искусственного интеллекта для совершенствования этих процессов. Кроме того, требования к точности вычислений в реальном времени, такие как надежность сети и соответствие законам физики, делают этот вызов еще более сложным. Наиболее уязвимыми становятся системы, где параллельно требуется высокая скорость реагирования и высококачественные вычисления, что делает необходимым развитие универсальных, прочно связанных систем управления. #### Метод Grid-Agent представляет собой многоагентную систему, основанную на Large Language Models (LLMs) и многоагентном reinforcement learning. Он состоит из двух основных модулей: планировочного агента и валидационного агента. **Планировочный агент** использует numerical power flow solvers для генерации последовательностей действий, направленных на устранение нарушений в сети. **Валидационный агент**, в свою очередь, применяет sandboxed execution с автоматическими safety rollbacks для оценки эффективности и стабильности действий. Фреймворк модифицирует сетевую модель в зависимости от ее размера и сложности, применяя adaptive multiscale network representation. Эта технология позволяет эффективно кодировать сеть, оптимизируя работу системы при различных условиях. Grid-Agent также включает встроенные возможности адаптации и обучения, чтобы лучше адаптироваться к разным сетевым топологиям и динамическим условиям эксплуатации. #### Результаты Выполнены эксперименты на IEEE и CIGRE test systems, включая IEEE 69-bus, CIGRE MV и IEEE 30-bus. Эти тестирования показали, что Grid-Agent эффективно устраняет нарушения в сети, обеспечивая быстрое реагирование и высокую точность. На основе результатов моделирования, Grid-Agent удалось улучшить не только скорость реагирования, но и точность решений в сетях с высокой степенью динамики. Например, в IEEE 30-bus system, фреймворк сумел уменьшить время реакции на нарушения в 2 раза по сравнению с традиционными методами, при этом сохранив высокую точность вычислений. Эти результаты демонстрируют высокую эффективность фреймворка в реальном времени для разных типов сетей. #### Значимость Grid-Agent может быть применен в различных областях, таких как управление сетями, динамическая оп

Annotation:

The increasing penetration of Distributed Energy Resources (DERs), widespread adoption of Electric Vehicles (EVs), and the growing frequency of extreme weather events have significantly increased the complexity of power grid planning, operation, and management. Traditional rule-based systems and numerical optimization approaches often struggle with the scale, dynamics, and adaptability required by modern power networks. This paper introduces Grid-Agent, an autonomous, AI-driven framework that co...

ID: 2508.05702v1 cs.MA, cs.AI, cs.SY, eess.SY

arXiv PDF

📄 Emergence of Fair Leaders via Mediators in Multi-Agent Reinforcement Learning

2025-08-09

Авторы:

Akshay Dodwadmath, Setareh Maghsudi

Задача установления справедливых лидеров в средах с множеством агентов, активно обсуждается в мультиагентном расширенном рейнфорсментном обучении (MARL). Традиционные Stackelberg-игры предполагают, что каждый этап игры заключается в действиях лидера, после чего следуют реакции слейвов. Однако выбор лидера может привести к несправедливости в ситуациях, где роль лидера и слейва меняется. Авторы показали, что установление лидера исходя из автоматического выделения лидера может привести к несправедливости в результатах. Для решения этой проблемы предложено интегрировать медиаторов (mediators) в среду мультиагентного лидер-слейв-мультиагентного расширенного рейнфорсментного обучения. Медиаторы могут управлять процессом действий лидеров в лидер-слейв-ситуации, где лидер выбирается на основе максимального уровня справедливости. Это решение позволяет максимизировать справедливость вознаграждений всех агентов, что приводит к справедливым результатам в целом.

Annotation:

Stackelberg games and their resulting equilibria have received increasing attention in the multi-agent reinforcement learning literature. Each stage of a traditional Stackelberg game involves a leader(s) acting first, followed by the followers. In situations where the roles of leader(s) and followers can be interchanged, the designated role can have considerable advantages, for example, in first-mover advantage settings. Then the question arises: Who should be the leader and when? A bias in the ...

ID: 2508.02421v1 cs.MA, cs.AI, cs.LG

arXiv PDF

📄 TransAM: Transformer-Based Agent Modeling for Multi-Agent Systems via Local Trajectory Encoding

2025-08-09

Авторы:

Conor Wallace, Umer Siddique, Yongcan Cao

Оптимальное агентское поведение в многоагентных системах зависит от точного понимания поведения других агентов. Однако в реальных приложениях часто недоступен полный доступ к истории действий других агентов, что ограничивает эффективность существующих подходов к их моделированию. В статье предлагается TransAM — новый подход, основанный на трансформерах, для моделирования агентов на основе локальных траекторий. Метод учится представлять поведение других агентов только на основе локальных данных управляемого агента. Оценка TransAM проводилась в различных многоагентных средах: кооперативных, конкурентных и смешанных. Результаты показали, что TransAM эффективно генерирует представления поведения других агентов, улучшает общую модель и повышает эпизодические вознаграждения. Этот подход может стать ключевым для решения проблемы моделирования агентов в условиях ограниченного доступа к их истории действий.

Annotation:

Agent modeling is a critical component in developing effective policies within multi-agent systems, as it enables agents to form beliefs about the behaviors, intentions, and competencies of others. Many existing approaches assume access to other agents' episodic trajectories, a condition often unrealistic in real-world applications. Consequently, a practical agent modeling approach must learn a robust representation of the policies of the other agents based only on the local trajectory of the co...

ID: 2508.02826v1 cs.MA, cs.AI

arXiv PDF

📄 Engineered over Emergent Communication in MARL for Scalable and Sample-Efficient Cooperative Task Allocation in a Partially Observable Grid

2025-08-09

Авторы:

Brennen A. Hill, Mant Koh En Wei, Thangavel Jishnuanandh

**Резюме** В данной работе рассматривается сравнение инженерного подхода к коммуникации (Engineered Communication) с инструментом под названием Learned Direct Communication (LDC) в рамках кооперативной многоагентной оркестрации задач в частично наблюдаемых средах. Инженерный подход включает в себя модель Imagined Trajectory Generation Module (ITGM) и Message Generation Network (MGN), которые формируют сообщения на основе прогнозированных будущих состояний. Исследование проводилось на задачах с различным уровнем сложности и видов наблюдаемости. Основным выводом является то, что инженерный подход демонстрирует более высокую эффективность и масштабируемость по сравнению с инструментом LDC. Это открытие показывает, что дизайн коммуникационных стратегий может опередить подходы, основанные на научном исследовании, в сложных, многоагентных средах.

Annotation:

We compare the efficacy of learned versus engineered communication strategies in a cooperative multi-agent reinforcement learning (MARL) environment. For the learned approach, we introduce Learned Direct Communication (LDC), where agents generate messages and actions concurrently via a neural network. Our engineered approach, Intention Communication, employs an Imagined Trajectory Generation Module (ITGM) and a Message Generation Network (MGN) to formulate messages based on predicted future stat...

ID: 2508.02912v1 cs.MA, cs.AI, cs.LG, cs.SY, eess.SY, 68T42, 68T05, 90C40, 93E35, 68T07, I.2.11; I.2.6; I.2.8

arXiv PDF

📄 When Agents Break Down in Multiagent Path Finding

2025-08-09

Авторы:

Foivos Fioravantes, Dušan Knop, Nikolaos Melissinos, Michal Opler

--- title: КОНТЕКСТ И ПРОБЛЕМАТИКА --- ### message # КОНТЕКСТ И ПРОБЛЕМАТИКА Multiagent Path Finding (MAPF) является ключевой областью исследований в современной робототехнике и искусственном интеллекте. Она заключается в построении эффективных, конфликто-свободных траекторий для множества агентов, которые перемещаются в сетевой структуре из начальных точек к целевым. Основной целью является минимизация makespan — времени, необходимого для того, чтобы все агенты достигли своих мест назначения. Однако в реальных сценариях агенты часто сталкиваются с непредвиденными сбоями и задержками, что создает значительные трудности для сохранения оптимальности расписания. При обработке таких сбоев традиционные подходы часто требуют полного пересчета расписания, что может быть вычислительно нецелесообразно или даже невозможно в ситуациях с ограниченными ресурсами. Более того, в сложных системах, где агенты могут иметь ограниченные вычислительные возможности, полная переработка расписания может привести к катастрофическим задержкам. Эти проблемы подчеркивают необходимость разработки методологий, которые позволяют агентам адаптироваться динамически к сбоям без полной перезагрузки системы. В этой работе авторы предлагают новый взгляд на MAPF, включая формальную модель сбоев и задержек агентов. Они фокусируются на разработке протоколов, которые позволяют агентам локально координироваться и адаптировать свои траектории на ходу, не прибегая к полной перезагрузке системы. Такой подход не только сокращает временные затраты, но также обеспечивает устойчивость системы в условиях непредвиденных событий. # ПРЕДЛОЖЕННЫЙ МЕТОД Авторы предлагают фреймворк для динамической адаптации расписаний, основанный на двух основных протоколах. Первый протокол, называемый "первичным коммуникационным протоколом", позволяет агентам локально координироваться и изменять свои траектории в ответ на сбои. Этот протокол гарантирует, что при возникновении $k$ сбоев увеличение makespan будет ограничено $k$ дополнительными ходами, что эффективно снижает влияние сбоев на общую эффективность системы. Второй протокол, названный "вторичным протоколом", разработан для систем, где агенты имеют ограниченные вычислительные ресурсы. В этом протоколе большая часть вычислений смещается на узлы сети, что позволяет сохранить эффективность и робастность системы без необходимости увеличения вычислительной мощности агентов. Этот подход обеспечивает баланс между вычислительной эффективностью и робастностью, что делает его применимым в реальных системах с ограниченными ресурсами. # ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Авторы провели серию экспериментов для оценки эффективности предложенных протоколов. Используя различные наборы данных, они моделировали сценарии с разной частотой и характером сбоев агентов. Результаты показали, что первичный протокол эффективно ограничивает увеличение makespace при сбоях, согласно теоретическим прогнозам. Вторичный протокол также демонстрирует высокую эффективность, особенно в системах с низким вычислительным потенциалом агентов. Кроме того, эксперименты подтвердили масштабируемость предложенного подхода. Даже в ситуациях с большим количеством агентов и сложной топологией сети, протоколы показали стабильное поведение и эффективность в управлении сбоями. # ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ Предложенные методы имеют широкое применение в областях, требующих эффективного управления множеством агентов, таких как логистика, роботизированные системы хранения, авиационный трафик и самостоятельные транспортные системы. Особенностью данного подхода является его способность обеспечить устойчивость и эффективность в реальном времени, что критически важно для приложений в динамических и непредсказуемых средах. # ВЫВОДЫ И ПЕРСПЕКТИВЫ В работе представлен фреймворк для решения проблем сбоев в MAPF, который обеспечивает эффективную и робастную адаптацию расписаний. Будущие исследования могут фокусироваться на расширении этих методов для более сложных сценариев, включая динамически изменяющиеся среды и системы с нелинейными зависимостями между агентами. Также предлагается исследовать возможности интеграции машинного обучения для дальнейшего улучшения адаптивности системы.

Annotation:

In Multiagent Path Finding (MAPF), the goal is to compute efficient, collision-free paths for multiple agents navigating a network from their sources to targets, minimizing the schedule's makespan-the total time until all agents reach their destinations. We introduce a new variant that formally models scenarios where some agents may experience delays due to malfunctions, posing significant challenges for maintaining optimal schedules. Recomputing an entirely new schedule from scratch after eac...

ID: 2508.03777v1 cs.MA, cs.AI

arXiv PDF

Показано 111 - 117 из 117 записей