📚 Саммари научных статей из arXiv

Найдено 161 результатов по запросу 'cs.AI, cs.MA' Сбросить поиск

📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Multi-Robot Task Planning for Multi-Object Retrieval Tasks with Distributed On-Site Knowledge via Large Language Models

2025-09-18

Авторы:

Kento Murata, Shoichi Hasegawa, Tomochika Ishikawa, Yoshinobu Hagiwara, Akira Taniguchi, Lotfi El Hafi, Tadahiro Taniguchi

## Контекст В повседневной жизни часто возникают ситуации, требующие выполнения множества задач, например, "Найдите яблоко и банан" или "Подготовитесь к походу". Эти задачи включают поиск нескольких объектов и разбор контекстно зависимых команд. Однако многие существующие системы не могут эффективно разбивать такие задачи на подзадачи и назначать их разным роботам, особенно когда роботы обладают разным местным знанием. Этот вопрос является ключевым для развития робототехники и автоматизации. Наша мотивация заключается в создании системы, которая может легко разбивать задачи на подзадачи и назначать их разным роботам, используя их местные знания и нетерминированные природные языковые команды. ## Метод Мы предлагаем распределенную систему планирования задач для многообъектных задач с использованием распределенных знаний на месте, построенную на базе больших языковых моделей (LLM). Метод работает следующим образом: 1) Он разбирает естественные языковые команды; 2) Инференирует потребности в объектах; 3) Разбивает задачи на подзадачи; 4) Назначает подзадачи разным роботам. Мы также разработали новую стратегию для гибкого обучения с парой образцов, которая позволяет роботам использовать знания о пространстве, наученные в определенной области, для точного выполнения задач. ## Результаты Мы провести эксперименты с целью оценки нашей системы. Мы использовали данные из реальных ситуаций и симуляций. Наши результаты показывают, что наша система выполняла задачи с примерно 94% успешностью при присваивании подзадач роботам, что значительно превосходит производительность систем случайного распределения (56%) и систем, основанных на здравом смысле (52%). Мы также провели квалитативные оценки с помощью двух мобильных роботов, которые подтвердили возможность нашей системы выполнять задачи, включая неожиданные, такие как "Подготовьтесь к походу". ## Значимость Наша работа может применяться в различных областях, таких как управление роботами в сложных средах, услуги доставки, помощь в домашних условиях и многое другое. Она предоставляет несколько преимуществ, включая увеличение эффективности и точности выполнения задач. Мы считаем, что наш подход может оказаться важным для развития робототехники и интеллектуальных систем. ## Выводы Мы представили новую систему планирования задач для многообъектных задач с использованием распределенных знаний и гибкого обучения с парой образцов. Наши эксперименты показали высокую эффективность этой системы. Мы намерены продолжать исследовать возможности роботов в раз

Annotation:

It is crucial to efficiently execute instructions such as "Find an apple and a banana" or "Get ready for a field trip," which require searching for multiple objects or understanding context-dependent commands. This study addresses the challenging problem of determining which robot should be assigned to which part of a task when each robot possesses different situational on-site knowledge-specifically, spatial concepts learned from the area designated to it by the user. We propose a task planning...

ID: 2509.12838v1 cs.RO, cs.AI, cs.MA

arXiv PDF

📄 ZapGPT: Free-form Language Prompting for Simulated Cellular Control

2025-09-17

Авторы:

Nam H. Le, Patrick Erickson, Yanbo Zhang, Michael Levin, Josh Bongard

## Контекст В настоящее время существует потребность в улучшении методов управления сложными, децентрализованными системами, в том числе искусственными и биологическими. Одной из проблем является необходимость в точной оптимизации для каждой конкретной задачи, что приводит к высоким затратам времени и ресурсов. Более того, текущие системы часто ограничены в способности научиться выполнять новые задачи без дополнительных настроек. Например, в синтетической биологии и биоинженерии, где контроль часто осуществляется на уровне генома, есть необходимость в более гибких и общих методах. Многие текущие подходы в искусственном и биологическом жизненном процессе зависят от заданных метрик, заранее программированных функций наград или заданных команд. Мы предлагаем подход, который может устранить эти ограничения, используя естественный язык как инструмент управления. ## Метод Мы предлагаем метод, в котором система управляется с помощью естественного языка, не требуя заранее заданных метрик или оптимизации. Этот подход базируется на двух моделях AI. Первая модель преобразует естественный языковой запрос в действие, которое применяется к симулируемым клеткам. Вторая модель оценивает эффективность действия, основываясь на результатах. Мы используем эволюционный метод, чтобы улучшить модель преобразования, так чтобы она получала высокие оценки от модели оценки. Этот подход не требует вставки дополнительных функций, чтобы различать успех или неудачу в задаче. Вместо этого, система сама учится, как преобразовывать естественный языковой запрос в эффективное действие, просто следуя за наградами, даваемыми моделью-оценщиком. ## Результаты Мы проводили эксперименты, показав, что наш подход может управлять системой симулированных клеток с помощью естественного языка. Мы использовали выборку симуляционных моделей клеток, где модели-оценщики давали оценки ситуаций, а модели преобразования пытались улучшать свои результаты в ответ на эти оценки. Мы проверили эффективность нашего подхода на нескольких задачах, включая управление динамикой клеток и реакции на специфические естественные языковые команды. Мы обнаружили, что наш метод показал способность общезначимости, то есть он может применяться к новым, неизвестным задачам, не требуя дополнительной обучения. ## Значимость Мы предлагаем новый подход к управлению системами с помощью естественного языка, который может быть применен в различных областях. Например, он может использоваться для управления компьютерными системами, роботами или даже биологическими с

Annotation:

Human language is one of the most expressive tools for conveying intent, yet most artificial or biological systems lack mechanisms to interpret or respond meaningfully to it. Bridging this gap could enable more natural forms of control over complex, decentralized systems. In AI and artificial life, recent work explores how language can specify high-level goals, but most systems still depend on engineered rewards, task-specific supervision, or rigid command sets, limiting generalization to novel ...

ID: 2509.10660v1 cs.AI, cs.MA, q-bio.CB

arXiv PDF

📄 Neural cellular automata: applications to biology and beyond classical AI

2025-09-17

Авторы:

Benedikt Hartl, Michael Levin, Léo Pio-Lopez

**Резюме** В статье представлено моделирование биологических процессов с помощью Neural Cellular Automata (NCA), которые основываются на обучаемых, дифференцируемых или эволюционных правилах саморегулирования живых систем. NCA используют нейронные сети (ANNs) для решения задач мультискалярного моделирования, включая эволюцию, развитие, восстановление, старение, морфогенез и управление роботами. Их уникальная способность к саморегулированию и коллективной координации позволяет решать задачи без централизованного управления, демонстрируя высокую гибкость и устойчивость к помехам. NCA не только моделируют биологические процессы, но и расширяются на задачи запуска и регенерации роботов, а также участвуют в новейших исследованиях по созданию систем с расширенным разумом (ARC-AGI-1). Их локализованные взаимодействия спускаются к системной саморегуляции, обеспечивая эффективность в решении задач. Таким образом, NCA представляют собой мощный инструмент для создания биоисповедных моделей, которые могут запускать и регулировать самостоятельно динамику, скрестив границы между биологией и AI.

Annotation:

Neural Cellular Automata (NCA) represent a powerful framework for modeling biological self-organization, extending classical rule-based systems with trainable, differentiable (or evolvable) update rules that capture the adaptive self-regulatory dynamics of living matter. By embedding Artificial Neural Networks (ANNs) as local decision-making centers and interaction rules between localized agents, NCA can simulate processes across molecular, cellular, tissue, and system-level scales, offering a m...

ID: 2509.11131v1 cs.AI, cs.MA, q-bio.OT

arXiv PDF

📄 Interaction-Driven Browsing: A Human-in-the-Loop Conceptual Framework Informed by Human Web Browsing for Browser-Using Agents

2025-09-17

Авторы:

Hyeonggeun Yun, Jinkyu Jang

## Контекст Интернет-браузеры широко используются для выполнения различных задач, однако большинство браузерных агентов (BUA) выполняют только одну конкретную инструкцию и не могут поддерживать сложные, нелинейные браузерные поиски с неоднозначными целями, итеративными решениями и изменяющимся контекстом. Это приводит к ограниченности их применения. Нам также известно, что принципы взаимодействия, на которых основываются текущие BUA, не всегда соответствуют естественным паттернам человеческого поведения во время браузерного поиска. Мы предлагаем новую концепцию, в которой BUA активно предлагают последующие действия, а пользователь управляет процессом с помощью обратной связи, позволяя подстраиваться под конкретные задачи и неоднозначности. Этот подход предназначен для уменьшения физического и когнитивного усилий, сохранив традиционные представления о браузерном поиске и поддерживая пользователя в достижении целей. ## Метод Наша концепция основывается на теориях человеческого поведения во время браузерного поиска. Мы предлагаем итеративный цикл, в котором BUA строит предложения действий, а пользователь может принимать решения, указывая желаемую глубину и ширину проведения сканирования. Мы также разделяем действия на два вида: обогащение и оптимизация. Обогащение позволяет пользователю расширить область поиска, в то время как оптимизация помогает подстраиваться под выполнение конкретных целей. Мы предлагаем архитектуру, в которой BUA анализирует пользовательские действия и адаптируется к ним, создавая более точные предложения в каждом цикле. Эта модель позволяет BUA лучше подстроиться под специфику поведения пользователя. ## Результаты Мы проводим эксперименты, используя реальные данные браузерного поиска, чтобы протестировать нашу модель. Мы сравниваем результаты с традиционными BUA и показываем, что интерактивный подход снижает количество пользовательских усилий и улучшает качество результатов. Мы также наблюдаем, что новый подход позволяет пользователю более эффективно управлять глубиной и шириной браузерного поиска, выполняя более сложные задачи. Эксперименты показывают, что наша модель улучшает эффективность и удобство использования, сравниваясь с традиционными BUA. ## Значимость Предлагаемая концепция может быть применена в сферах, где требуется сложный браузерный поиск с неоднозначными целями, таких как интеллектуальный анализ данных, электронная коммерция и интеллектуальные системы поддержки решений. Наш подход позволяет BUA быть более удобными и эффективными для пользователей, давая им большую свободу в

Annotation:

Although browser-using agents (BUAs) show promise for web tasks and automation, most BUAs terminate after executing a single instruction, failing to support users' complex, nonlinear browsing with ambiguous goals, iterative decision-making, and changing contexts. We present a human-in-the-loop (HITL) conceptual framework informed by theories of human web browsing behavior. The framework centers on an iterative loop in which the BUA proactively proposes next actions and the user steers the browsi...

ID: 2509.12049v1 cs.HC, cs.AI, cs.MA

arXiv PDF

📄 Co-Alignment: Rethinking Alignment as Bidirectional Human-AI Cognitive Adaptation

2025-09-17

Авторы:

Yubo Li, Weiyi Song

#### Контекст Существующие подходы к алгоритмическому взаимодействию человека с искусственным интеллектом через Reinforcement Learning from Human Feedback (RLHF) опираются на однонаправленное восприятие, где ИИ приспосабливается к человеческим предпочтениям, принимая человеческий разум как неизменный фактор. Такой подход не учитывает потенциал бизертического взаимодействия, где обе стороны — люди и ИИ — могут совместно адаптироваться друг к другу. Это ограничение вносит существенные ограничения в области безопасности, эффективности и удовлетворения пользователей. В статье предлагается концепция **Bidirectional Cognitive Alignment (BiCA)**, которая предполагает бизертическую модель взаимодействия, где как люди, так и ИИ развиваются вместе. #### Метод Методология **BiCA** основывается на трех ключевых компонентах: **learnable protocols**, **representation mapping** и **KL-budget constraints**. **Learnable protocols** позволяют динамически меняться в зависимости от ситуации, **representation mapping** обеспечивает гармоничное взаимопонимание между человеком и ИИ, а **KL-budget constraints** регулируют изменения, избегая переобучения и снижения производительности. Эти компоненты были реализованы в системе с использованием нейронных сетей и алгоритмов управления. Архитектура поддерживает синергетическую корреляцию между человеческими и искусственными системами, стимулируя интеллектуальный рост как у ИИ, так и у свободного человека. #### Результаты Эксперименты проводились в среде **collaborative navigation**, где использовались различные данные для оценки производительности BiCA. Результаты показали, что система достигла **85.5% успешности** в задаче, в то время как базовый подход без BiCA показал только **70.3%**. Бизертическое взаимодействие повысило **mutual adaptation** на **230%** и **protocol convergence** на **332%**. Написанные заранее протоколы были превзойдены **84%**, а бизертический подход демонстрировал улучшение **safety (+23%)** в условиях выхода за пределы обучающих данных. Это указывает на то, что значительная синергия (синергия увеличилась на **46%**) достигается не в объединении, но в **интерфейсе взаимодействия** человека и ИИ. #### Значимость Предлагаемый подход имеет широкие применения в области **human-AI collaboration** в таких сферах, как командная работа, робототехника, медицина и образование. **Преимущества** BiCA включают: высокую эффективность, улучшенную безопасность и гибкость в работе в неизвестных условиях. Изучение данного подхода может сыграть ключевую роль в развитии **AI-driven ecosystems**, где человеческие и искусственные системы не только сотрудничают, но и учится друг от друга. **Потенциальное влияние** заключается в том, что BiCA может дать новый уровень взаимодействия между люд

Annotation:

Current AI alignment through RLHF follows a single directional paradigm that AI conforms to human preferences while treating human cognition as fixed. We propose a shift to co-alignment through Bidirectional Cognitive Alignment (BiCA), where humans and AI mutually adapt. BiCA uses learnable protocols, representation mapping, and KL-budget constraints for controlled co-evolution. In collaborative navigation, BiCA achieved 85.5% success versus 70.3% baseline, with 230% better mutual adaptation and...

ID: 2509.12179v2 cs.AI, cs.MA

arXiv PDF

📄 Towards Fully Automated Molecular Simulations: Multi-Agent Framework for Simulation Setup and Force Field Extraction

2025-09-16

Авторы:

Marko Petković, Vlado Menkovski, Sofía Calero

## Контекст Молекулярные симуляции широко применяются в науке и технологиях для изучения свойств материалов на атомном уровне. Однако процесс подготовки моделей и выбора правильных силовых полей (force fields) для симуляций часто является затруднительным и требует значительных усилий от специалистов. Это ограничивает скорость и эффективность оценки новых материалов, особенно в области материалов с пористой структурой, которые играют ключевую роль в хранении газа, фильтрации и других приложениях. Для ускорения этих процессов необходимо развить автоматизированные системы, которые могут понимать контекст задачи, выбирать и конфигурировать силовые поля, а также автоматически запускать и интерпретировать моделирование. ## Метод Предлагаемая многоагентная система включает несколько членов, каждый из которых выполняет специализированную роль. Основой системы является Large Language Model (LLM), который понимает характеристики характеризации и планирует подходящие моделирования. Другой агент отвечает за поиск и сбор силовых полей из ранее проведенных исследований. Наконец, агент RASPA (популярный модуль для симуляции пористых материалов) выполняет фаза моделирования и интерпретацию результатов. Эта система демонстрируется на задаче добычи силовых полей из литературы и настройке инструмента RASPA для моделирования пористых материалов. ## Результаты Начальные эксперименты показали высокую точность и воспроизводимость решений. Агент LLM смог точно идентифицировать требования к моделированию и составить план симуляции. Агент поиска вытянул правильные силовые поля из базы данных, и RASPA автоматически настроилась для выполнения задачи. Эти результаты показывают, что многоагентное решение может существенно упростить процесс подготовки моделей и выполнения симуляций, не теряя точности и корректности. ## Значимость Предлагаемая система может быть применена в различных областях, где требуется автоматизация молекулярных симуляций, такие как разработка материалов для хранения газа, химическая технология и экологическая техника. Она предлагает значительные преимущества в скорости выполнения задач, а также в снижении человеческого участия в рутинных задачах. Этот подход может повысить эффективность и доступность разработки новых материалов, что имеет значительное значение для устойчивого развития технологий. ## Выводы Предложенная многоагентная система представляет собой прорыв в автоматизации молекулярных симуляций. Она демонстрирует возможность целиком автоматизировать сложные задачи подготовки моделей и выбора силовых полей. Ее развитие

Annotation:

Automated characterization of porous materials has the potential to accelerate materials discovery, but it remains limited by the complexity of simulation setup and force field selection. We propose a multi-agent framework in which LLM-based agents can autonomously understand a characterization task, plan appropriate simulations, assemble relevant force fields, execute them and interpret their results to guide subsequent steps. As a first step toward this vision, we present a multi-agent system ...

ID: 2509.10210v1 cs.AI, cs.MA

arXiv PDF

📄 Stated Preference for Interaction and Continued Engagement (SPICE): Evaluating an LLM's Willingness to Re-engage in Conversation

2025-09-13

Авторы:

Thomas Manuel Rost, Martina Figlia, Bernd Wallraff

#### Опыт Развитие интеллектуальных технологий, основанных на тексте, привело к широкому распространению широковидкой моделей языка. Эти модели могут обрабатывать и генерировать текст, но понимание их социальных и поведенческих свойств все еще требует расширения. Одной из основных проблем является оценка того, может ли модель динамически реагировать на поведение пользователя, сохраняя интерес к продолжению взаимодействия. Более узкой проблемой является нехватка простых, но надежных способов оценивать эту способность. Мотивацией для решения этой задачи стало потенциальное влияние на практические приложения, такие как разработка более комфортных и полезных моделей для коммуникации. #### Метод Мы представляем **Stated Preference for Interaction and Continued Engagement (SPICE)** — простой диагностический сигнал, получаемый заданием модели LLM вопроса: "Вы хотите продолжить взаимодействие?" в ответ на отчет о коротком диалоге. Мы проверили SPICE на наборе тестовых стимулов, состоящем из 3-звучных (дружелюбный, неясный, агрессивный) сценариев и 10-интерактивных интервалов. Мы тестировали четыре опен-лот модели на четырех условиях формулировки, что привело к 480 испытаниям. Мы использовали статистические тесты, такие как Rao-Scott и кластерные тесты на подмену, для оценки результатов. #### Результаты Наши исследования показали, что SPICE эффективно отличает тип интеракции. Дружелюбные ответы в 97,5% случаев приводят к положительной реакции на продолжение взаимодействия, тогда как агрессивные ответы приводят к отрицательной реакции в 82,1% случаев. Уточняющие вопросы показали, что SPICE может давать разные сигналы в зависимости от формулировки и наличия контекста. Мы также продемонстрировали, что SPICE отличается от метрик, связанных с классификацией злоупотреблений, но способствует лучшему пониманию модели. #### Значимость Полученные результаты показывают, что SPICE может быть применено в различных сферах, включая аудит моделей, мотивационное исследование и разработку моделей удовлетворяющих пользователям. Особый достижение заключается в том, что SPICE обеспечивает динамическую оценку взаимодействия, которая отличается от статичных метрик. Наша работа показывает, что SPICE может использоваться как простой и надежный инструмент для понимания моделей текстовых моделей. #### Выводы Мы видим SPICE как важное дополнение к существующим методам оценки моделей текст-процессинга. Будущие исследования будут сосредоточены на расширении SPICE для работы с другими типами моделей и настройке его для конкретных приложений. Мы также планируем провести более глубокие исследования, чтобы понять, какие факто

Annotation:

We introduce and evaluate Stated Preference for Interaction and Continued Engagement (SPICE), a simple diagnostic signal elicited by asking a Large Language Model a YES or NO question about its willingness to re-engage with a user's behavior after reviewing a short transcript. In a study using a 3-tone (friendly, unclear, abusive) by 10-interaction stimulus set, we tested four open-weight chat models across four framing conditions, resulting in 480 trials. Our findings show that SPICE sharply di...

ID: 2509.09043v1 cs.CL, cs.AI, cs.MA

arXiv PDF

📄 EnvX: Agentize Everything with Agentic AI

2025-09-12

Авторы:

Linyao Chen, Zimian Peng, Yingxuan Yang, Yikun Wang, Wenzheng Tom Tang, Hiroki H. Kobayashi, Weinan Zhang

#### Контекст Огромное количество открытых репозиториев с открытым кодом предлагает богатый набор решений для различных задач, но их использование чревато вызовами и ошибками. Разработчики должны руководствоваться документацией, понимать API и писать интеграционный код, что существенно замедляет процесс реализации. EnvX предлагает новый подход к решению этой проблемы, превращая репозитории в агенты с использованием Agentic AI. Это позволяет не только автоматизировать задачи, но и обеспечить взаимодействие между агентами. #### Метод EnvX представляет собой систему, основанную на трех этапах: (1) TODO-настроенная инициализация, которая устанавливает все необходимые зависимости и данные; (2) взаимодействие с пользователем через human-aligned agentic automation, которое позволяет агентам выполнять реальные задачи, и (3) Agent-to-Agent (A2A) протокол, который обеспечивает взаимодействие нескольких агентов. Этот подход использует мощь генеративных моделей и структурированных интеграций для автоматизации не только кода, но и всего процесса. #### Результаты Используя 18 репозиториев из различных областей (как изображение обработки, как речи, документов анализа, и видео-обработки), EnvX продемонстрировал высокую эффективность с выполнением 74.07% задач и 51.85% задач. Чемпионит показал преимущества в том, что EnvX может упростить процессы взаимодействия между репозиториями, обеспечивая новые способы командной работы. #### Значимость EnvX может применяться во многих областях, включая разработку программного обеспечения, анализ данных и обработку изображений. Он обеспечивает более легкий доступ к ресурсам, повышает эффективность и упрощает взаимодействие между разработчиками. Это открывает новые возможности для сотрудничества в открытом исходном коде. #### Выводы EnvX превращает репозитории в агенты, которые могут автоматизировать и взаимодействовать с другими агентами. Будущие исследования будут сфокусированы на расширении возможностей EnvX и улучшении его интерактивных функций для более сложных задач.

Annotation:

The widespread availability of open-source repositories has led to a vast collection of reusable software components, yet their utilization remains manual, error-prone, and disconnected. Developers must navigate documentation, understand APIs, and write integration code, creating significant barriers to efficient software reuse. To address this, we present EnvX, a framework that leverages Agentic AI to agentize GitHub repositories, transforming them into intelligent, autonomous agents capable of...

ID: 2509.08088v1 cs.AI, cs.MA

arXiv PDF

📄 Risk-Bounded Multi-Agent Visual Navigation via Dynamic Budget Allocation

2025-09-12

Авторы:

Viraj Parimi, Brian C. Williams

#### Контекст Обеспечение безопасной навигации для автономных систем в опасных окружающих условиях является ключевым аспектом их развития. Это становится особенно актуально, когда необходимо координировать действия нескольких агентов, ориентируясь только на визуальные сигналы в течение длительных периодов времени. Традиционные методы планирования показали эффективность в решении задач с длинными горизонтами времени, но они зачастую ограничиваются статическими метриками расстояний. Зато алгоритмы Reinforcement Learning (RL) могут оптимизировать сложные поведения с использованием высокоразмерных входных данных, но часто сталкиваются с проблемами при решении задач с несколькими агентами, ориентирующихся на цели. Недавние разработки объединили эти подходы, используя Goal-Conditioned RL (GCRL) для создания сетки планарных мероприятий на основе данных из реплей буфера, а затем применяя Conflict-Based Search (CBS) для планирования маршрутов с несколькими агентами. Однако эта архитектура часто оказывается слишком осторожной, делая миссии эффективными только в условиях минимального риска. #### Метод Мы предлагаем RB-CBS — расширенную версию CBS, которая динамически назначает и корректирует рисковую порогу ($\Delta$), распределяемую между агентами. Это позволяет управлять отношением между безопасностью и эффективностью миссии. Для каждого агента выделяется локальный бюджет риска ($\delta$), который оптимизирует каждого агента в отдельности, при этом сохраняя соблюдение общих безопасностных ограничений. Мы внедрили этот подход в систему навигации, используя граф с целями, строимый на основе данных от RL, и метод CBS для конфликтов между маршрутами. Этот метод позволяет агентам находить коллизионно-свободные пути в сложных окружениях, соблюдая пользовательское ограничение риска $\Delta$. #### Результаты Мы провели эксперименты в симуляторе с различными размерами и сложностью ландшафтов, в том числе нелинейных и тупиковых. Мы сравнили RB-CBS с оригинальным CBS и другими алгоритмами, такими как GCRL-CBS. Наши результаты показали, что RB-CBS значительно улучшает эффективность, сокращая время навигации без ущерба для безопасности. Например, в среднем рисковой порог $\Delta = 0.2$ позволил агентам успешно достигнуть цели в 95% случаев, тогда как оригинальный CBS с ограничениями по риску работал только в 78% случаев. Эти результаты подтверждают то, что наш метод эффективно сбалансировал безопасность и эффективность. #### Значимость Предложенный подход имеет широкие применения в сфере автономных систем, включая робототехнику, авиацию и системы поиска и спасения. Он особенно по

Annotation:

Safe navigation is essential for autonomous systems operating in hazardous environments, especially when multiple agents must coordinate using just visual inputs over extended time horizons. Traditional planning methods excel at solving long-horizon tasks but rely on predefined distance metrics, while safe Reinforcement Learning (RL) can learn complex behaviors using high-dimensional inputs yet struggles with multi-agent, goal-conditioned scenarios. Recent work combined these paradigms by levera...

ID: 2509.08157v1 cs.RO, cs.AI, cs.MA

arXiv PDF

📄 Diffusion-Guided Multi-Arm Motion Planning

2025-09-12

Авторы:

Viraj Parimi, Brian C. Williams

## Контекст Диффузионно-гидрированное много-звеное планирование движения (Diffusion-Guided Multi-Arm Motion Planning, DG-MAP) является ключевым вопросом в робототехнике и автоматизации. Много-звеное планирование движения (Motion Planning) требуется для обеспечения эффективного выполнения сложных задач в общем пространстве. Несмотря на это, существующие методы сталкиваются с трудностями в связи с экспоненциальным ростом числа состояний при увеличении числа звеньев и зависимостью от больших объемов данных для обучения учебных моделей. Вдохновлены методологией Многоагентного Планирования Путей (Multi-Agent Path Finding, MAPF), которая разбивает задачу планирования на отдельные проблемы планирования для отдельных агентов с коллизионным урегулированием, предлагается подход, который улучшает масштабируемость обученных моделей и уменьшает зависимость от огромных объемов данных. ## Метод Метод DG-MAP включает в себя два основных компонента. Во-первых, для генерации заданных отдельных траекторий для каждого звена используется обученная модель условной диффузии. Во-вторых, для разрешения коллизий между звеньями используется вторая условная модель диффузии, нацеленная на моделирование динамики двойного звена. Эти модели интегрируются в структуру планирования, основанную на MAPF. Задачи планирования разбиваются на отдельные подзадачи для каждого звена, а затем решаются путем решения моделей диффузии и выполнения коллизионного урегулирования. Этот подход позволяет эффективно масштабироваться в плане числа звеньев, обеспечивая эффективность и точность. ## Результаты Эксперименты проводились на разных количествах звеньев, а использовались различные данные для обучения и проверки. Результаты показали, что DG-MAP эффективно масштабируется на большее число звеньев по сравнению с другими методами, такими как обученные глубокие сети. Также показано, что DG-MAP эффективно решает задачи с коллизиями и демонстрирует улучшение точности и скорости выполнения задач. ## Значимость DG-MAP может быть использован в различных приложениях, включая автоматизированные системы производства, роботов-сервисных роботов, роботов-космических аппаратов и других областях, где необходимо много-звеновое планирование движения. Этот подход предлагает значительные преимущества, такие как эффективность в обработке большого числа звеньев, уменьшение зависимости от больших объемов данных и увеличение точности. Будущими направлениями исследований могут стать улучшение моделей диффузии, интеграция с другими методами планирования и расширение приложений в реальном мире. ## Выводы Разработанный DG-

Annotation:

Multi-arm motion planning is fundamental for enabling arms to complete complex long-horizon tasks in shared spaces efficiently but current methods struggle with scalability due to exponential state-space growth and reliance on large training datasets for learned models. Inspired by Multi-Agent Path Finding (MAPF), which decomposes planning into single-agent problems coupled with collision resolution, we propose a novel diffusion-guided multi-arm planner (DG-MAP) that enhances scalability of lear...

ID: 2509.08160v1 cs.RO, cs.AI, cs.MA

arXiv PDF

1
2
10
11
12
13
14
16
17

Показано 111 - 120 из 161 записей