ProgD: Progressive Multi-scale Decoding with Dynamic Graphs for Joint Multi-agent Motion Forecasting
2509.09210v1
cs.AI, cs.RO
2025-09-13
Авторы:
Xing Gao, Zherui Huang, Weiyao Lin, Xiao Sun
Резюме на русском
## Контекст
Проблема аккуратной прогнозирования поведения окружающих агентов является ключевой для безопасного планирования движения автономных транспортных средств. Несмотря на необходимость учета множественных взаимодействий между агентами, существующие подходы часто ограничиваются моделированием отдельных субъектов или используют методы, не учитывающие вариабельность взаимодействий в процессе прогнозирования. Эти ограничения приводят к неточности и нестабильности результатов. Наша мотивация заключается в разработке системы, которая не только учитывает интерактивность агентов, но и адаптируется к изменяющимся сценариям на протяжении прогноза.
## Метод
Мы предлагаем **ProgD**, прогрессивную стратегию мультискалевого декодирования с применением динамических графов. Модель основывается на сценарии, описываемым в виде графа с динамическими и гетерогенными структурами. Это позволяет эксплицитно ловить взаимодействия между агентами, которые меняются в процессе прогноза. Для уменьшения неопределенности в мульти-агентных сценариях мы используем перекрывающиеся динамические графы и многоуровневый декодирований. Это позволяет не только учитывать начальные неопределенности, но и прогнозировать более точно динамические изменения взаимодействий. Использование факторизованной архитектуры обеспечивает эффективное обработку спато-временных зависимостей.
## Результаты
Мы проверили ProgD на двух важных бенчмарках: INTERACTION и Argoverse 2. Модель показала лучшие результаты по сравнению с состязающимися подходами. Она показала отличный результат в точности прогноза, специально улучшив показатели на задачах, требующих адаптации к изменяющимся взаимодействиям между агентами. Это подтверждается тестами, где ProgD показала существенное преимущество по всем метрикам относительно соревновательных методов.
## Значимость
Предлагаемый подход может применяться в автоматизированных системах управления транспортными средствами, где точность прогноза важна для безопасности и эффективности. Он улучшает моделирование сценариев с разными уровнями детализации, что позволяет более точно предсказывать движения в различных условиях. Благодаря динамическим графам ProgD подходит для сложных сценариев с неопределенностью в динамике взаимодействий.
## Выводы
Мы представили ProgD, новый подход к многоагентной прогнозированию, который использует динамические графы и многоуровневое декодирование для эффективного моделирования взаимодействий. Наши эксперименты показали, что ProgD значительно превосходит конкурирующие подходы. Мы пла
Abstract
Accurate motion prediction of surrounding agents is crucial for the safe
planning of autonomous vehicles. Recent advancements have extended prediction
techniques from individual agents to joint predictions of multiple interacting
agents, with various strategies to address complex interactions within future
motions of agents. However, these methods overlook the evolving nature of these
interactions. To address this limitation, we propose a novel progressive
multi-scale decoding strategy, termed ProgD, with the help of dynamic
heterogeneous graph-based scenario modeling. In particular, to explicitly and
comprehensively capture the evolving social interactions in future scenarios,
given their inherent uncertainty, we design a progressive modeling of scenarios
with dynamic heterogeneous graphs. With the unfolding of such dynamic
heterogeneous graphs, a factorized architecture is designed to process the
spatio-temporal dependencies within future scenarios and progressively
eliminate uncertainty in future motions of multiple agents. Furthermore, a
multi-scale decoding procedure is incorporated to improve on the future
scenario modeling and consistent prediction of agents' future motion. The
proposed ProgD achieves state-of-the-art performance on the INTERACTION
multi-agent prediction benchmark, ranking $1^{st}$, and the Argoverse 2
multi-world forecasting benchmark.
Ссылки и действия
Дополнительные ресурсы: