Intention-Aware Diffusion Model for Pedestrian Trajectory Prediction
2508.07146v1
cs.CV, cs.AI
2025-08-13
Авторы:
Yu Liu, Zhijie Liu, Xiao Ren, You-Fu Li, He Kong
Резюме на русском
#### Контекст
Предсказание движения пешеходов является критическим аспектом планирования маршрутов и управления движением автономных транспортных средств. Несмотря на то, что развивающиеся методы становятся все более точными, одной из проблем является недостаточная учета потенциальных целей движения пешеходов. Без точного моделирования поведенческих интентов может возникать неточность в прогнозировании. Это приводит к нежелательным ситуациям, таким как непредвиденные столкновения или неточное планирование маршрутов. Наша мотивация заключается в создании модели, которая не только точно предсказывает движение, но и учитывает семантические аспекты, такие как цели и интенты пешеходов.
#### Метод
Мы предлагаем рамоку Intention-Aware Diffusion Model, которая интегрирует семантическое моделирование поведения пешеходов. Шорт-терм интент представляется с помощью резидуального полярного представления. Это позволяет разделить направление и масштаб движения, чтобы лучше передать локальные модели движения. Для лонг-терм интента используется токен-базированный предиктор конечной точки, который вырабатывает несколько возможных целей со связанными вероятностями. Это позволяет учесть многомиодальность и контекстуальные аспекты предсказания. Дополнительно, мы улучшаем процесс диффузии с помощью адаптивного руководства и резидуального шумового предиктора, улучшающего степень точности денойсинга.
#### Результаты
Мы проверяли нашу модель на трех ключевых датасетах: ETH, UCY, и SDD. Наши результаты показали, что Intention-Aware Diffusion Model превосходит состояние технологии по метрикам FDE (Final Displacement Error) и ADE (Average Displacement Error). Мы также проверили точность предсказания интентов, показав, что наша модель эффективно моделирует как локальные, так и глобальные цели движения.
#### Значимость
Модель имеет широкие перспективы применения в автономных системах, например, в дорожном трафике, робототехнике и мультимедийном контроле. Она позволяет улучшить точность предсказания, уменьшить непредвиденные ситуации и повысить безопасность в интеракции автомобилей с пешеходами. Модель также предоставляет новые возможности для продвинутого моделирования поведенческих интентов, которые могут быть применимы в других областях, таких как коммерческие системы прогнозирования потребления.
#### Выводы
Мы успешно применили технологии диффузии для моделирования поведенческих интентов пешеходов. Наша модель демонстрирует высокую точность в предсказании интентов и движения в целом. Будущие исследования будут направлены на расширение модели для поддержки более сложных сценариев и увеличение
Abstract
Predicting pedestrian motion trajectories is critical for the path planning
and motion control of autonomous vehicles. Recent diffusion-based models have
shown promising results in capturing the inherent stochasticity of pedestrian
behavior for trajectory prediction. However, the absence of explicit semantic
modelling of pedestrian intent in many diffusion-based methods may result in
misinterpreted behaviors and reduced prediction accuracy. To address the above
challenges, we propose a diffusion-based pedestrian trajectory prediction
framework that incorporates both short-term and long-term motion intentions.
Short-term intent is modelled using a residual polar representation, which
decouples direction and magnitude to capture fine-grained local motion
patterns. Long-term intent is estimated through a learnable, token-based
endpoint predictor that generates multiple candidate goals with associated
probabilities, enabling multimodal and context-aware intention modelling.
Furthermore, we enhance the diffusion process by incorporating adaptive
guidance and a residual noise predictor that dynamically refines denoising
accuracy. The proposed framework is evaluated on the widely used ETH, UCY, and
SDD benchmarks, demonstrating competitive results against state-of-the-art
methods.
Ссылки и действия
Дополнительные ресурсы: