📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 When Planners Meet Reality: How Learned, Reactive Traffic Agents Shift nuPlan Benchmarks

2025-10-18

Авторы:

Steffen Hagedorn, Luka Donkov, Aron Distelzweig, Alexandru P. Condurache

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Planner evaluation in closed-loop simulation often uses rule-based traffic agents, whose simplistic and passive behavior can hide planner deficiencies and bias rankings. Widely used IDM agents simply follow a lead vehicle and cannot react to vehicles in adjacent lanes, hindering tests of complex interaction capabilities. We address this issue by integrating the state-of-the-art learned traffic agent model SMART into nuPlan. Thus, we are the first to evaluate planners under more realistic conditi...

ID: 2510.14677v1 cs.RO, cs.AI, cs.LG, cs.MA

arXiv PDF

📄 Physics-Informed Neural Controlled Differential Equations for Scalable Long Horizon Multi-Agent Motion Forecasting

2025-10-04

Авторы:

Shounak Sural, Charles Kekeh, Wenliang Liu, Federico Pecora, Mouhacine Benosman

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Long-horizon motion forecasting for multiple autonomous robots is challenging due to non-linear agent interactions, compounding prediction errors, and continuous-time evolution of dynamics. Learned dynamics of such a system can be useful in various applications such as travel time prediction, prediction-guided planning and generative simulation. In this work, we aim to develop an efficient trajectory forecasting model conditioned on multi-agent goals. Motivated by the recent success of physics-g...

ID: 2510.00401v1 cs.RO, cs.AI, cs.LG, cs.MA

arXiv PDF

📄 Sequence Pathfinder for Multi-Agent Pickup and Delivery in the Warehouse

2025-10-01

Авторы:

Zeyuan Zhao, Chaoran Li, Shao Zhang, Ying Wen

## Контекст Multi-Agent Pickup and Delivery (MAPD) является усложненной формой Multi-Agent Path Finding (MAPF), требующей от агентов выполнять задачи с фиксированными точками подбора и доставки в последовательном порядке. Хотя learning-based методы демонстрируют улучшения в MAPD, они часто сталкиваются с проблемами в сложных средах, таких как хранилища, с узкими проходами и длинными коридорами. Эти окружения требуют сильной связности и глобального видения, но ограниченность локальных сенсоров и точечная связь в локальной модели не позволяют эффективно решить эти проблемы. В настоящей работе мы исследуем возможности применения моделей последовательностей для MAPD и доказываем, что подходы, основанные на sequence modeling, обладают order-invariant optimality, делая их применимыми для MAPD. Этот подход позволяет существенно уменьшить вычислительную сложность и заменить точечную связь на модель связи с широким покрытием. ## Метод Мы предлагаем Sequential Pathfinder (SePar), основанный на Transformer-парадигме, чтобы решить задачу MAPD. Модель SePar использует self-attention механизмы для implicit information exchange, обеспечивая глобальное видение и эффективное дистрибутивное распределение решений. Эта модель преобразует сложность вычислений из экспоненциальной в линейную, ускоряя решение в сложных средах. SePar также включает imitation learning в сложных задачах, таких как warehouse-like среды, что позволяет повысить точность и скорость решения, даже при недостаточном обучении на реальных данных. ## Результаты В экспериментах мы сравнили SePar с другими state-of-the-art методами в MAPD на разных наборах данных. Результаты показали, что SePar постоянно демонстрирует лучшие результаты в MAPD и их вариациях, превосходя другие learning-based методы в скорости и точности. Более того, SePar показал гибкость в общении с новыми, неизвестными средами и выполнении задач, которые приводят к коллизиям в стандартных подходах. ## Значимость Предлагаемый подход может быть применен в различных сложных средах, таких как роботов-дроны, автономные автомобили и warehouse management. Он предлагает существенные преимущества, включая снижение затрат на вычисления, увеличение скорости решения и гибкость в различных окружениях. Это может привести к улучшению производительности в задачах многоагентного управления в робототехнике и логистике. ## Выводы Мы доказали, что sequence modeling является эффективным подходом для MAPD и что SePar может быть значительным шагом в решении MAPD в warehouse-like средах. Наша модель показала лучшие результаты в сравнении с другими методами и обеспечила гибкость в работе с новыми средами. Будущие исследования будут направлены на дальнейшее улучшение модели и ее применение в задачах робототехнического управления.

Annotation:

Multi-Agent Pickup and Delivery (MAPD) is a challenging extension of Multi-Agent Path Finding (MAPF), where agents are required to sequentially complete tasks with fixed-location pickup and delivery demands. Although learning-based methods have made progress in MAPD, they often perform poorly in warehouse-like environments with narrow pathways and long corridors when relying only on local observations for distributed decision-making. Communication learning can alleviate the lack of global inform...

ID: 2509.23778v2 cs.RO, cs.AI, cs.LG, cs.MA

arXiv PDF

📄 ASTREA: Introducing Agentic Intelligence for Orbital Thermal Autonomy

2025-09-19

Авторы:

Alejandro D. Mousist

## Контекст Обеспечение автономных операций на борту космических аппаратов представляет одну из самых актуальных проблем в современном космонавтике. Одним из ключевых аспектов этой задачи является эффективное управление тепловыми ресурсами, которое требует достоверного и адаптивного контроля при минимальном потреблении ресурсов. Несмотря на то, что существуют технологии для управления тепловыми ресурсами, они часто требуют значительных вычислительных ресурсов и не вполне удовлетворяют требованиям минимализации отказов в условиях активного оперативного режима. В этом контексте проект ASTREA (Autonomous Spacecraft Thermal REgulation Agent) представляет собой крутой шаг вперед, поскольку предлагает решение, которое объединяет семантическую рациональность и адаптивный контроль в одной системе. ## Метод ASTREA широко использует технологии глубокого обучения, в частности, развитие Large Language Model (LLM) и распределенных систем рекомендаций. Основной инновацией является интеграция LLM-агента с реинфорсмент-контроллером в рамках асинхронной архитектуры. Эта конфигурация позволяет гибко адаптироваться к условиям реальных космических операций. Особенностью методологии является использование тренажерного центра с большим набором тестовых данных, позволяющих тренировать и проверять систему в условиях, наблюдаемых в космосе. Таким образом, ASTREA предлагает новый подход к космическим операциям, который включает в себя агентскую логику и рациональный подход к решению проблемы теплового регулирования. ## Результаты Проведенные эксперименты показали, что на главной платформе ASTREA, работающей на земле, LLM-агент значительно улучшает тепловую стабильность и снижает частоту нарушений. Он показал способность системы адаптироваться к нестандартным ситуациям, что демонстрирует мощность глубокого обучения в решении проблем управления космическими тепловыми ресурсами. Однако, при переходе на борт Международной Космической Станции (МКС), было выявлено некоторое снижение эффективности, связанное с задержками в обработке информации. Эти задержки становятся критичными в условиях быстрых тепловых циклов, которые характерны для спутников в низкую орбиту Земли (ЛОС). Таким образом, результаты показывают, что, несмотря на прогресс, есть технические вызовы, которые требуют улучшения. ## Значимость ASTREA может быть применена в широком кругу задач, связанных с космическими операциями, включая не только тепловое регулирование, но и другие аспекты автономного управления. Одним из основных преимущест

Annotation:

This paper presents ASTREA, the first agentic system deployed on flight-heritage hardware (TRL 9) for autonomous spacecraft operations. Using thermal control as a representative use case, we integrate a resource-constrained Large Language Model (LLM) agent with a reinforcement learning controller in an asynchronous architecture tailored for space-qualified platforms. Ground experiments show that LLM-guided supervision improves thermal stability and reduces violations, confirming the feasibility ...

ID: 2509.13380v1 cs.RO, cs.AI, cs.LG, cs.MA, cs.SY, eess.SY

arXiv PDF