Intention-Aware Diffusion Model for Pedestrian Trajectory Prediction

2508.07146v1 cs.CV, cs.AI 2025-08-13
Авторы:

Yu Liu, Zhijie Liu, Xiao Ren, You-Fu Li, He Kong

Резюме на русском

#### Контекст Предсказание движения пешеходов является критическим аспектом планирования маршрутов и управления движением автономных транспортных средств. Несмотря на то, что развивающиеся методы становятся все более точными, одной из проблем является недостаточная учета потенциальных целей движения пешеходов. Без точного моделирования поведенческих интентов может возникать неточность в прогнозировании. Это приводит к нежелательным ситуациям, таким как непредвиденные столкновения или неточное планирование маршрутов. Наша мотивация заключается в создании модели, которая не только точно предсказывает движение, но и учитывает семантические аспекты, такие как цели и интенты пешеходов. #### Метод Мы предлагаем рамоку Intention-Aware Diffusion Model, которая интегрирует семантическое моделирование поведения пешеходов. Шорт-терм интент представляется с помощью резидуального полярного представления. Это позволяет разделить направление и масштаб движения, чтобы лучше передать локальные модели движения. Для лонг-терм интента используется токен-базированный предиктор конечной точки, который вырабатывает несколько возможных целей со связанными вероятностями. Это позволяет учесть многомиодальность и контекстуальные аспекты предсказания. Дополнительно, мы улучшаем процесс диффузии с помощью адаптивного руководства и резидуального шумового предиктора, улучшающего степень точности денойсинга. #### Результаты Мы проверяли нашу модель на трех ключевых датасетах: ETH, UCY, и SDD. Наши результаты показали, что Intention-Aware Diffusion Model превосходит состояние технологии по метрикам FDE (Final Displacement Error) и ADE (Average Displacement Error). Мы также проверили точность предсказания интентов, показав, что наша модель эффективно моделирует как локальные, так и глобальные цели движения. #### Значимость Модель имеет широкие перспективы применения в автономных системах, например, в дорожном трафике, робототехнике и мультимедийном контроле. Она позволяет улучшить точность предсказания, уменьшить непредвиденные ситуации и повысить безопасность в интеракции автомобилей с пешеходами. Модель также предоставляет новые возможности для продвинутого моделирования поведенческих интентов, которые могут быть применимы в других областях, таких как коммерческие системы прогнозирования потребления. #### Выводы Мы успешно применили технологии диффузии для моделирования поведенческих интентов пешеходов. Наша модель демонстрирует высокую точность в предсказании интентов и движения в целом. Будущие исследования будут направлены на расширение модели для поддержки более сложных сценариев и увеличение

Abstract

Predicting pedestrian motion trajectories is critical for the path planning and motion control of autonomous vehicles. Recent diffusion-based models have shown promising results in capturing the inherent stochasticity of pedestrian behavior for trajectory prediction. However, the absence of explicit semantic modelling of pedestrian intent in many diffusion-based methods may result in misinterpreted behaviors and reduced prediction accuracy. To address the above challenges, we propose a diffusion-based pedestrian trajectory prediction framework that incorporates both short-term and long-term motion intentions. Short-term intent is modelled using a residual polar representation, which decouples direction and magnitude to capture fine-grained local motion patterns. Long-term intent is estimated through a learnable, token-based endpoint predictor that generates multiple candidate goals with associated probabilities, enabling multimodal and context-aware intention modelling. Furthermore, we enhance the diffusion process by incorporating adaptive guidance and a residual noise predictor that dynamically refines denoising accuracy. The proposed framework is evaluated on the widely used ETH, UCY, and SDD benchmarks, demonstrating competitive results against state-of-the-art methods.

Ссылки и действия