📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
📄 When Planners Meet Reality: How Learned, Reactive Traffic Agents Shift nuPlan Benchmarks
2025-10-18Авторы:
Steffen Hagedorn, Luka Donkov, Aron Distelzweig, Alexandru P. Condurache
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Planner evaluation in closed-loop simulation often uses rule-based traffic
agents, whose simplistic and passive behavior can hide planner deficiencies and
bias rankings. Widely used IDM agents simply follow a lead vehicle and cannot
react to vehicles in adjacent lanes, hindering tests of complex interaction
capabilities. We address this issue by integrating the state-of-the-art learned
traffic agent model SMART into nuPlan. Thus, we are the first to evaluate
planners under more realistic conditi...
Авторы:
Shounak Sural, Charles Kekeh, Wenliang Liu, Federico Pecora, Mouhacine Benosman
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Long-horizon motion forecasting for multiple autonomous robots is challenging
due to non-linear agent interactions, compounding prediction errors, and
continuous-time evolution of dynamics. Learned dynamics of such a system can be
useful in various applications such as travel time prediction,
prediction-guided planning and generative simulation. In this work, we aim to
develop an efficient trajectory forecasting model conditioned on multi-agent
goals. Motivated by the recent success of physics-g...
Авторы:
Zeyuan Zhao, Chaoran Li, Shao Zhang, Ying Wen
## Контекст
Multi-Agent Pickup and Delivery (MAPD) является усложненной формой Multi-Agent Path Finding (MAPF), требующей от агентов выполнять задачи с фиксированными точками подбора и доставки в последовательном порядке. Хотя learning-based методы демонстрируют улучшения в MAPD, они часто сталкиваются с проблемами в сложных средах, таких как хранилища, с узкими проходами и длинными коридорами. Эти окружения требуют сильной связности и глобального видения, но ограниченность локальных сенсоров и точечная связь в локальной модели не позволяют эффективно решить эти проблемы.
В настоящей работе мы исследуем возможности применения моделей последовательностей для MAPD и доказываем, что подходы, основанные на sequence modeling, обладают order-invariant optimality, делая их применимыми для MAPD. Этот подход позволяет существенно уменьшить вычислительную сложность и заменить точечную связь на модель связи с широким покрытием.
## Метод
Мы предлагаем Sequential Pathfinder (SePar), основанный на Transformer-парадигме, чтобы решить задачу MAPD. Модель SePar использует self-attention механизмы для implicit information exchange, обеспечивая глобальное видение и эффективное дистрибутивное распределение решений. Эта модель преобразует сложность вычислений из экспоненциальной в линейную, ускоряя решение в сложных средах.
SePar также включает imitation learning в сложных задачах, таких как warehouse-like среды, что позволяет повысить точность и скорость решения, даже при недостаточном обучении на реальных данных.
## Результаты
В экспериментах мы сравнили SePar с другими state-of-the-art методами в MAPD на разных наборах данных. Результаты показали, что SePar постоянно демонстрирует лучшие результаты в MAPD и их вариациях, превосходя другие learning-based методы в скорости и точности. Более того, SePar показал гибкость в общении с новыми, неизвестными средами и выполнении задач, которые приводят к коллизиям в стандартных подходах.
## Значимость
Предлагаемый подход может быть применен в различных сложных средах, таких как роботов-дроны, автономные автомобили и warehouse management. Он предлагает существенные преимущества, включая снижение затрат на вычисления, увеличение скорости решения и гибкость в различных окружениях. Это может привести к улучшению производительности в задачах многоагентного управления в робототехнике и логистике.
## Выводы
Мы доказали, что sequence modeling является эффективным подходом для MAPD и что SePar может быть значительным шагом в решении MAPD в warehouse-like средах. Наша модель показала лучшие результаты в сравнении с другими методами и обеспечила гибкость в работе с новыми средами. Будущие исследования будут направлены на дальнейшее улучшение модели и ее применение в задачах робототехнического управления.
Annotation:
Multi-Agent Pickup and Delivery (MAPD) is a challenging extension of
Multi-Agent Path Finding (MAPF), where agents are required to sequentially
complete tasks with fixed-location pickup and delivery demands. Although
learning-based methods have made progress in MAPD, they often perform poorly in
warehouse-like environments with narrow pathways and long corridors when
relying only on local observations for distributed decision-making.
Communication learning can alleviate the lack of global inform...
Авторы:
Alejandro D. Mousist
## Контекст
Обеспечение автономных операций на борту космических аппаратов представляет одну из самых актуальных проблем в современном космонавтике. Одним из ключевых аспектов этой задачи является эффективное управление тепловыми ресурсами, которое требует достоверного и адаптивного контроля при минимальном потреблении ресурсов. Несмотря на то, что существуют технологии для управления тепловыми ресурсами, они часто требуют значительных вычислительных ресурсов и не вполне удовлетворяют требованиям минимализации отказов в условиях активного оперативного режима. В этом контексте проект ASTREA (Autonomous Spacecraft Thermal REgulation Agent) представляет собой крутой шаг вперед, поскольку предлагает решение, которое объединяет семантическую рациональность и адаптивный контроль в одной системе.
## Метод
ASTREA широко использует технологии глубокого обучения, в частности, развитие Large Language Model (LLM) и распределенных систем рекомендаций. Основной инновацией является интеграция LLM-агента с реинфорсмент-контроллером в рамках асинхронной архитектуры. Эта конфигурация позволяет гибко адаптироваться к условиям реальных космических операций. Особенностью методологии является использование тренажерного центра с большим набором тестовых данных, позволяющих тренировать и проверять систему в условиях, наблюдаемых в космосе. Таким образом, ASTREA предлагает новый подход к космическим операциям, который включает в себя агентскую логику и рациональный подход к решению проблемы теплового регулирования.
## Результаты
Проведенные эксперименты показали, что на главной платформе ASTREA, работающей на земле, LLM-агент значительно улучшает тепловую стабильность и снижает частоту нарушений. Он показал способность системы адаптироваться к нестандартным ситуациям, что демонстрирует мощность глубокого обучения в решении проблем управления космическими тепловыми ресурсами. Однако, при переходе на борт Международной Космической Станции (МКС), было выявлено некоторое снижение эффективности, связанное с задержками в обработке информации. Эти задержки становятся критичными в условиях быстрых тепловых циклов, которые характерны для спутников в низкую орбиту Земли (ЛОС). Таким образом, результаты показывают, что, несмотря на прогресс, есть технические вызовы, которые требуют улучшения.
## Значимость
ASTREA может быть применена в широком кругу задач, связанных с космическими операциями, включая не только тепловое регулирование, но и другие аспекты автономного управления. Одним из основных преимущест
Annotation:
This paper presents ASTREA, the first agentic system deployed on
flight-heritage hardware (TRL 9) for autonomous spacecraft operations. Using
thermal control as a representative use case, we integrate a
resource-constrained Large Language Model (LLM) agent with a reinforcement
learning controller in an asynchronous architecture tailored for
space-qualified platforms. Ground experiments show that LLM-guided supervision
improves thermal stability and reduces violations, confirming the feasibility
...