VariAntNet: Learning Decentralized Control of Multi-Agent Systems
2509.02271v1
cs.LG, cs.AI, cs.MA
2025-09-05
Авторы:
Yigal Koifman, Erez Koifman, Eran Iceland, Ariel Barel, Alfred M. Bruckstein
Резюме на русском
## Контекст
Многоагентные системы (МАС) представляют собой набор независимых агентов, которые действуют совместно для достижения общей цели. Они широко применяются в различных областях, включая диагностику, управление транспортом, сборку и даже формировании групп войск. Одним из примеров МАС являются "ант-роботы" — простые беспилотные транспортные средства, оперирующие в рамках ограниченного диапазона чувствительности и без доступа к ортогональным системам координат. Однако, существуют серьезные проблемы, которые ограничивают эффективность МАС в подобных ситуациях. Например, невозможность централизованного управления, ограниченная область видимости и нельзясть использования распределенной системы координат существенно повлияли на успех многих миссий. Таким образом, необходимо разрабатывать модели, позволяющие агентам эффективно взаимодействовать в условиях подобных ограничений.
## Метод
Мы предлагаем VariAntNet — новую децентрализованную модель управления многоагентной системой, основанную на глубоком обучении. Основная идея заключается в использовании различных функций потерь, которые продвигают целевые свойства, такие как связность и групповое движение. Модель использует неупорядоченные, переменного размера наблюдения, выполняемые с помощью геометрических признаков. Оптимизация происходит с использованием алгоритма, который производит сопоставление между агентами и матрицей видимости. Эта матрица позволяет агентам определять друг друга, несмотря на ограничения возможностей чувствительности. Этот подход позволяет нам учитывать вклад каждого агента в коллективную работу и оптимизировать выбор между сохранением связности и выполнением задачи в условиях ограниченных ресурсов.
## Результаты
Мы провели эксперименты, сравнивая VariAntNet с другими моделями управления МАС в задаче сбора агентов. Для этого были использованы классические модели, такие как "гармоническое поле", которая используется в аналитических решениях. В результате, VariAntNet достиг гораздо вышего уровня конвергенции, при этом увеличивая скорость сбора. Сравнительное исследование показало, что VariAntNet значительно превосходит алгоритмы с гармоническими полями, предлагая более высокую скорость сбора, при этом сохраняя связность между агентами. Это делает VariAntNet особенно эффективным для время от времени выполненных задач, таких как поиск жертв в условиях катастрофы.
## Значимость
VariAntNet может быть применено в различных областях, в том числе в аварийных реагированиях, промышленном автоматизированном изготовлении и
Abstract
A simple multi-agent system can be effectively utilized in disaster response
applications, such as firefighting. Such a swarm is required to operate in
complex environments with limited local sensing and no reliable inter-agent
communication or centralized control. These simple robotic agents, also known
as Ant Robots, are defined as anonymous agents that possess limited sensing
capabilities, lack a shared coordinate system, and do not communicate
explicitly with one another. A key challenge for simple swarms lies in
maintaining cohesion and avoiding fragmentation despite limited-range sensing.
Recent advances in machine learning offer effective solutions to some of the
classical decentralized control challenges. We propose VariAntNet, a deep
learning-based decentralized control model designed to facilitate agent
swarming and collaborative task execution. VariAntNet includes geometric
features extraction from unordered, variable-sized local observations. It
incorporates a neural network architecture trained with a novel,
differentiable, multi-objective, mathematically justified loss function that
promotes swarm cohesiveness by utilizing the properties of the visibility graph
Laplacian matrix. VariAntNet is demonstrated on the fundamental multi-agent
gathering task, where agents with bearing-only and limited-range sensing must
gather at some location. VariAntNet significantly outperforms an existing
analytical solution, achieving more than double the convergence rate while
maintaining high swarm connectivity across varying swarm sizes. While the
analytical solution guarantees cohesion, it is often too slow in practice. In
time-critical scenarios, such as emergency response operations where lives are
at risk, slower analytical methods are impractical and justify the loss of some
agents within the swarm. This paper presents and analyzes this trade-off in
detail.
Ссылки и действия
Дополнительные ресурсы: