VariAntNet: Learning Decentralized Control of Multi-Agent Systems

2509.02271v1 cs.LG, cs.AI, cs.MA 2025-09-05

Авторы:

Yigal Koifman, Erez Koifman, Eran Iceland, Ariel Barel, Alfred M. Bruckstein

Резюме на русском

## Контекст Многоагентные системы (МАС) представляют собой набор независимых агентов, которые действуют совместно для достижения общей цели. Они широко применяются в различных областях, включая диагностику, управление транспортом, сборку и даже формировании групп войск. Одним из примеров МАС являются "ант-роботы" — простые беспилотные транспортные средства, оперирующие в рамках ограниченного диапазона чувствительности и без доступа к ортогональным системам координат. Однако, существуют серьезные проблемы, которые ограничивают эффективность МАС в подобных ситуациях. Например, невозможность централизованного управления, ограниченная область видимости и нельзясть использования распределенной системы координат существенно повлияли на успех многих миссий. Таким образом, необходимо разрабатывать модели, позволяющие агентам эффективно взаимодействовать в условиях подобных ограничений. ## Метод Мы предлагаем VariAntNet — новую децентрализованную модель управления многоагентной системой, основанную на глубоком обучении. Основная идея заключается в использовании различных функций потерь, которые продвигают целевые свойства, такие как связность и групповое движение. Модель использует неупорядоченные, переменного размера наблюдения, выполняемые с помощью геометрических признаков. Оптимизация происходит с использованием алгоритма, который производит сопоставление между агентами и матрицей видимости. Эта матрица позволяет агентам определять друг друга, несмотря на ограничения возможностей чувствительности. Этот подход позволяет нам учитывать вклад каждого агента в коллективную работу и оптимизировать выбор между сохранением связности и выполнением задачи в условиях ограниченных ресурсов. ## Результаты Мы провели эксперименты, сравнивая VariAntNet с другими моделями управления МАС в задаче сбора агентов. Для этого были использованы классические модели, такие как "гармоническое поле", которая используется в аналитических решениях. В результате, VariAntNet достиг гораздо вышего уровня конвергенции, при этом увеличивая скорость сбора. Сравнительное исследование показало, что VariAntNet значительно превосходит алгоритмы с гармоническими полями, предлагая более высокую скорость сбора, при этом сохраняя связность между агентами. Это делает VariAntNet особенно эффективным для время от времени выполненных задач, таких как поиск жертв в условиях катастрофы. ## Значимость VariAntNet может быть применено в различных областях, в том числе в аварийных реагированиях, промышленном автоматизированном изготовлении и

Abstract

A simple multi-agent system can be effectively utilized in disaster response applications, such as firefighting. Such a swarm is required to operate in complex environments with limited local sensing and no reliable inter-agent communication or centralized control. These simple robotic agents, also known as Ant Robots, are defined as anonymous agents that possess limited sensing capabilities, lack a shared coordinate system, and do not communicate explicitly with one another. A key challenge for simple swarms lies in maintaining cohesion and avoiding fragmentation despite limited-range sensing. Recent advances in machine learning offer effective solutions to some of the classical decentralized control challenges. We propose VariAntNet, a deep learning-based decentralized control model designed to facilitate agent swarming and collaborative task execution. VariAntNet includes geometric features extraction from unordered, variable-sized local observations. It incorporates a neural network architecture trained with a novel, differentiable, multi-objective, mathematically justified loss function that promotes swarm cohesiveness by utilizing the properties of the visibility graph Laplacian matrix. VariAntNet is demonstrated on the fundamental multi-agent gathering task, where agents with bearing-only and limited-range sensing must gather at some location. VariAntNet significantly outperforms an existing analytical solution, achieving more than double the convergence rate while maintaining high swarm connectivity across varying swarm sizes. While the analytical solution guarantees cohesion, it is often too slow in practice. In time-critical scenarios, such as emergency response operations where lives are at risk, slower analytical methods are impractical and justify the loss of some agents within the swarm. This paper presents and analyzes this trade-off in detail.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

VariAntNet: Learning Decentralized Control of Multi-Agent Systems

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

A Hierarchical Hybrid AI Approach: Integrating Deep Reinforcement Learning and S...

Can Vibe Coding Beat Graduate CS Students? An LLM vs. Human Coding Tournament on...

A Mathematical Framework for Custom Reward Functions in Job Application Evaluati...

Large Language Model-Based Reward Design for Deep Reinforcement Learning-Driven ...

Partial Action Replacement: Tackling Distribution Shift in Offline MARL

Навигация