📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Johannes Gaber, Meshal Alharbi, Daniele Gammelli, Gioele Zardini

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Large robot fleets are now common in warehouses and other logistics settings, where small control gains translate into large operational impacts. In this article, we address task scheduling for lifelong Multi-Agent Pickup-and-Delivery (MAPD) and propose a hybrid method that couples learning-based global guidance with lightweight optimization. A graph neural network policy trained via reinforcement learning outputs a desired distribution of free agents over an aggregated warehouse graph. This sig...
ID: 2512.03194v1 cs.RO, cs.LG, cs.MA
Авторы:

Darren Chiu, Zhehui Huang, Ruohai Ge, Gaurav S. Sukhatme

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Nano-UAV teams offer great agility yet face severe navigation challenges due to constrained onboard sensing, communication, and computation. Existing approaches rely on high-resolution vision or compute-intensive planners, rendering them infeasible for these platforms. We introduce LEARN, a lightweight, two-stage safety-guided reinforcement learning (RL) framework for multi-UAV navigation in cluttered spaces. Our system combines low-resolution Time-of-Flight (ToF) sensors and a simple motion pla...
ID: 2511.17765v1 cs.RO, cs.LG, cs.MA
Авторы:

Kevin Qiu, Marek Cygan

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Automating the co-design of a robot's morphology and control is a long-standing challenge due to the vast design space and the tight coupling between body and behavior. We introduce Debate2Create (D2C), a framework in which large language model (LLM) agents engage in a structured dialectical debate to jointly optimize a robot's design and its reward function. In each round, a design agent proposes targeted morphological modifications, and a control agent devises a reward function tailored to exp...
ID: 2510.25850v1 cs.RO, cs.LG, cs.MA
Авторы:

Jesús Roche, Eduardo Sebastián, Eduardo Montijano

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Learning control policies for multi-robot systems (MRS) remains a major challenge due to long-term coordination and the difficulty of obtaining realistic training data. In this work, we address both limitations within an imitation learning framework. First, we shift the typical role of Curriculum Learning in MRS, from scalability with the number of robots, to focus on improving long-term coordination. We propose a curriculum strategy that gradually increases the length of expert trajectories dur...
ID: 2509.25097v2 cs.RO, cs.LG, cs.MA
Авторы:

Nicolas Pfitzer, Eduardo Sebastián, Ajay Shankar, Amanda Prorok

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
This paper presents a framework towards prompting multi-robot teams with high-level tasks using natural language expressions. Our objective is to use the reasoning capabilities demonstrated by recent language models in understanding and decomposing human expressions of intent, and repurpose these for multi-robot collaboration and decision-making. The key challenge is that an individual's behavior in a collective can be hard to specify and interpret, and must continuously adapt to actions from ot...
ID: 2509.24575v1 cs.RO, cs.LG, cs.MA
Авторы:

Jesús Roche, Eduardo Sebastián, Eduardo Montijano

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Learning control policies for multi-robot systems (MRS) remains a major challenge due to long-term coordination and the difficulty of obtaining realistic training data. In this work, we address both limitations within an imitation learning framework. First, we shift the typical role of Curriculum Learning in MRS, from scalability with the number of robots, to focus on improving long-term coordination. We propose a curriculum strategy that gradually increases the length of expert trajectories dur...
ID: 2509.25097v1 cs.RO, cs.LG, cs.MA
Авторы:

Zhang Xueyao, Yang Bo, Yu Zhiwen, Cao Xuelin, George C. Alexandropoulos, Merouane Debbah, Chau Yuen

## Контекст В последние годы Autonomous Underwater Vehicles (AUVs) — подводные лодки с автономным управлением — приобрели важное место в области кооперативного обнаружения и разведки. Они обладают уникальными возможностями, такими как долговременное пребывание в акватории и незаметность для прицеливания. Однако использование таких лодок в совместных миссиях не без рисков. В адверсарских условиях возможность разглашения своего положения, обнаружения и атаки может ограничить эффективность выполнения задачи. Значительным технологическим вызовом является создание методов, которые позволят AUVs эффективно сотрудничать, при этом гарантируя низкую вероятность обнаружения. Эта проблема особенно актуальна в регионах, где акватория тщательно мониторится, например, рядом с военными базами или границами. Многие алгоритмы, предложенные ранее, не могут гарантировать как эффективность, так и безопасность в таких сценариях. Таким образом, необходимо разработать метод, который сможет компенсировать эти недостатки, обеспечив безопасность и эффективность в одновременном режиме. ## Метод Разрабатываемый подход основан на **Hierarchical Multi-Agent Proximal Policy Optimization (H-MAPPO)**, технике машинного обучения, которая применяется в задачах управления множеством агентов. Метод работает на двух разных временных масштабах: высоком (high-level) и низком (low-level). На высоком уровне, центральный AUV (центральное устройство) решает, какие агенты должны принимать участие в задаче, а также определяет их основные цели и задачи. На низком уровне, каждый участвующий AUV контролирует свои траектории и мощность передачи сигналов, чтобы снизить риск обнаружения. Здесь используется **Proximal Policy Optimization (PPO)**, метод оптимизации политик, который позволяет эффективно корректировать поведение AUVs в реальном времени. Архитектура H-MAPPO разделяет задачу на две части: стратегическую (высокого уровня) и траекторную (низкого уровня). Эта структура позволяет агентам быстро реагировать на изменения окружения, при этом оптимизируя время отклика и минимизируя вероятность разглашения. ## Результаты Эксперименты проводились в симуляторе, где были рассмотрены различные ситуации, в том числе с высокой вероятностью обнаружения, многорукими бандами врагов и сильным шумом фона. Запуски проводились с различными наборами параметров, включая различные конфигурации AUVs, различные уровни шума и различные виды атак врагов. Использовались данные, полученные от реальных подводных лодок, чтобы убедиться в реалистичности моделей. Результаты показали, что H-MAPPO успешно оптимизирует решения, снижая вероятность обнаруж
Annotation:
Autonomous Underwater Vehicles (AUVs) have shown great potential for cooperative detection and reconnaissance. However, collaborative AUV communications introduce risks of exposure. In adversarial environments, achieving efficient collaboration while ensuring covert operations becomes a key challenge for underwater cooperative missions. In this paper, we propose a novel dual time-scale Hierarchical Multi-Agent Proximal Policy Optimization (H-MAPPO) framework. The high-level component determines ...
ID: 2509.13381v1 cs.RO, cs.LG, cs.MA
Авторы:

Jiaxi Huang, Yan Huang, Yixian Zhao, Wenchao Meng, Jinming Xu

#################################################### ## Контекст #################################################### **Контекст** Коллективное обучение (Collaborative Learning) является ключевым подходом для улучшения производительности и адаптивности многоробочных систем в решении сложных задач. Однако оно сталкивается с значительными затруднениями, связанными с высокой нагрузкой на связь (communication overhead) и сложностями, возникающими из-за неоднородности данных (data heterogeneity), обусловленной разнообразием задач и окружающими условиями. Эти проблемы становятся особенно актуальными в средах, где роботы должны ориентироваться в реальном времени, адаптироваться к изменениям и обрабатывать неидентичные данные (non-IID data). В настоящей работе предлагается CoCoL (Communication Efficient Decentralized Collaborative Learning) — метод, специально разработанный для многоробочных систем, где участники обучаются на неоднородных локальных данных. CoCoL рассчитан на минимизацию объема связи и вычислительных затрат, чтобы обеспечить высокую эффективность и точность в таких сложных условиях. #################################################### ## Метод #################################################### **Метод** CoCoL основывается на рамках Мира (Mirror Descent), которая позволяет организовать эффективные обновления с приближенным новыон-типом (approximate Newton-type updates). Данный подход позволяет значительно сократить нагрузку на связь, так как эти обновления учитывают семантическую схожесть между локальными функционалами задач. Для того, чтобы уменьшить вычислительные затраты, CoCoL применяет методы решения опорного суб-задачи с неточностью (inexact sub-problem solutions). Кроме того, в CoCoL внедрена схема отслеживания градиентов (gradient tracking), которая повышает устойчивость метода к неоднородности данных и позволяет роботам координировать свои решения в условиях варьирующейся топологии сети (time-varying network topologies). Это делает CoCoL легко адаптируемым к различным сложностям, таким как неидентичность данных (non-IID), потоковые данные (streaming data) и динамические сетевые структуры. #################################################### ## Результаты #################################################### **Результаты** Исследования проводились на трех представительных задачах многоробочного коллективного обучения. Эксперименты показали, что CoCoL значительно уменьшает число требуемых сетевых раундов и объем потребляемой пропускной способности (bandwidth) по сравнению с текущими методами. Это достигается без потери точности, которая соответствует состоянию техники (state-of-the-art accuracy). В частности, на задаче неидентичных данных (non-IID), где роботы обучаются на различных подвыборках, CoCoL показал существенный выигрыш в скорости обучения и уменьшение потребления ресурсов. Также были проверены сценарии с потоковыми данными и меняющейся топологией сети, где CoCoL подтвердил свою высокую устойчивость и эффективность. #################################################### ## Значимость #################################################### **Значимость** CoCoL может быть применен
Annotation:
Collaborative learning enhances the performance and adaptability of multi-robot systems in complex tasks but faces significant challenges due to high communication overhead and data heterogeneity inherent in multi-robot tasks. To this end, we propose CoCoL, a Communication efficient decentralized Collaborative Learning method tailored for multi-robot systems with heterogeneous local datasets. Leveraging a mirror descent framework, CoCoL achieves remarkable communication efficiency with approxima...
ID: 2508.20898v1 cs.RO, cs.LG, cs.MA