ProgD: Progressive Multi-scale Decoding with Dynamic Graphs for Joint Multi-agent Motion Forecasting

2509.09210v1 cs.AI, cs.RO 2025-09-13
Авторы:

Xing Gao, Zherui Huang, Weiyao Lin, Xiao Sun

Резюме на русском

## Контекст Проблема аккуратной прогнозирования поведения окружающих агентов является ключевой для безопасного планирования движения автономных транспортных средств. Несмотря на необходимость учета множественных взаимодействий между агентами, существующие подходы часто ограничиваются моделированием отдельных субъектов или используют методы, не учитывающие вариабельность взаимодействий в процессе прогнозирования. Эти ограничения приводят к неточности и нестабильности результатов. Наша мотивация заключается в разработке системы, которая не только учитывает интерактивность агентов, но и адаптируется к изменяющимся сценариям на протяжении прогноза. ## Метод Мы предлагаем **ProgD**, прогрессивную стратегию мультискалевого декодирования с применением динамических графов. Модель основывается на сценарии, описываемым в виде графа с динамическими и гетерогенными структурами. Это позволяет эксплицитно ловить взаимодействия между агентами, которые меняются в процессе прогноза. Для уменьшения неопределенности в мульти-агентных сценариях мы используем перекрывающиеся динамические графы и многоуровневый декодирований. Это позволяет не только учитывать начальные неопределенности, но и прогнозировать более точно динамические изменения взаимодействий. Использование факторизованной архитектуры обеспечивает эффективное обработку спато-временных зависимостей. ## Результаты Мы проверили ProgD на двух важных бенчмарках: INTERACTION и Argoverse 2. Модель показала лучшие результаты по сравнению с состязающимися подходами. Она показала отличный результат в точности прогноза, специально улучшив показатели на задачах, требующих адаптации к изменяющимся взаимодействиям между агентами. Это подтверждается тестами, где ProgD показала существенное преимущество по всем метрикам относительно соревновательных методов. ## Значимость Предлагаемый подход может применяться в автоматизированных системах управления транспортными средствами, где точность прогноза важна для безопасности и эффективности. Он улучшает моделирование сценариев с разными уровнями детализации, что позволяет более точно предсказывать движения в различных условиях. Благодаря динамическим графам ProgD подходит для сложных сценариев с неопределенностью в динамике взаимодействий. ## Выводы Мы представили ProgD, новый подход к многоагентной прогнозированию, который использует динамические графы и многоуровневое декодирование для эффективного моделирования взаимодействий. Наши эксперименты показали, что ProgD значительно превосходит конкурирующие подходы. Мы пла

Abstract

Accurate motion prediction of surrounding agents is crucial for the safe planning of autonomous vehicles. Recent advancements have extended prediction techniques from individual agents to joint predictions of multiple interacting agents, with various strategies to address complex interactions within future motions of agents. However, these methods overlook the evolving nature of these interactions. To address this limitation, we propose a novel progressive multi-scale decoding strategy, termed ProgD, with the help of dynamic heterogeneous graph-based scenario modeling. In particular, to explicitly and comprehensively capture the evolving social interactions in future scenarios, given their inherent uncertainty, we design a progressive modeling of scenarios with dynamic heterogeneous graphs. With the unfolding of such dynamic heterogeneous graphs, a factorized architecture is designed to process the spatio-temporal dependencies within future scenarios and progressively eliminate uncertainty in future motions of multiple agents. Furthermore, a multi-scale decoding procedure is incorporated to improve on the future scenario modeling and consistent prediction of agents' future motion. The proposed ProgD achieves state-of-the-art performance on the INTERACTION multi-agent prediction benchmark, ranking $1^{st}$, and the Argoverse 2 multi-world forecasting benchmark.

Ссылки и действия