Beyond Frame-wise Tracking: A Trajectory-based Paradigm for Efficient Point Cloud Tracking

2509.11453v1 cs.CV, cs.AI, cs.RO 2025-09-17
Авторы:

BaiChen Fan, Sifan Zhou, Jian Li, Shibo Zhao, Muqing Cao, Qin Wang

Резюме на русском

## Контекст Одна из ключевых задач в системах робототехники и автономного управления является LiDAR-based 3D single object tracking (3D SOT). Это помогает определять, следить и предсказывать движение объектов вокруг автомобиля. Существующие методы могут быть разделены на два типа: методы на основе двух кадров, которые эффективны, но могут недостаточно учитывать длительный контекст движения, и методы на основе последовательностей, которые обеспечивают более высокую точность, но требуют больших вычислительных ресурсов. Эти проблемы могут приводить к неточности в определении и слежении за движением во временах спада производительности, например в сценах с плохой видимостью или оккультацией. Требуется система, которая обеспечивала бы высокую точность, но при этом была бы эффективной в обработке. ## Метод Мы предлагаем новую модель TrajTrack, основанную на парадигме траекторий, которая улучшает работу двухкадрового системы для моделирования движения. TrajTrack не требует дополнительных точечных облаков для моделирования движения. Вместо этого она использует исторические данные о движении в виде боксиров, что позволяет эффективно определять движение. Модель состоит из двух основных модулей: **Explicit Motion Proposal** и **Implicit Motion Modeling**. Используя предыдущие движения, она строит быстрый предложенный путь, а затем улучшает его с помощью модуля моделирования движения. Это позволяет TrajTrack обеспечить высокую точность с меньшим расходом ресурсов. ## Результаты Мы проверили TrajTrack на бенчмарке NuScenes. Модель показала существенное улучшение в точности слежения за объектом на 4,48% по сравнению с базовым двухкадровым методом. Кроме того, TrajTrack работает с высокой скоростью — 56 кадров в секунду, что делает его эффективным для реального времени. Мы также проверили TrajTrack с разными базовыми моделями и показали, что он обладает сильной генерализуемостью. Эти результаты подтверждают сильную гибкость и эффективность нашего подхода в различных условиях. ## Значимость Модель TrajTrack может быть применена в различных задачах робототехники, в том числе для слежения за объектами в автоматизированном вождении, в системах безопасности, в системах управления роботами. Также TrajTrack обеспечивает высокую точность с меньшими вычислительными затратами, что делает его эффективным для применения на реальных устройствах. Этот подход может существенно повлиять на развитие систем автономного управления, сделав их более точными и надежными. ## Выводы Мы представили новую модель TrajTrack, основанную на парадигме траекторий, которая позволяет улучшить точность слежения за объектом в LiDAR-based 3D SOT. Модель TrajTrack показала высокую

Abstract

LiDAR-based 3D single object tracking (3D SOT) is a critical task in robotics and autonomous systems. Existing methods typically follow frame-wise motion estimation or a sequence-based paradigm. However, the two-frame methods are efficient but lack long-term temporal context, making them vulnerable in sparse or occluded scenes, while sequence-based methods that process multiple point clouds gain robustness at a significant computational cost. To resolve this dilemma, we propose a novel trajectory-based paradigm and its instantiation, TrajTrack. TrajTrack is a lightweight framework that enhances a base two-frame tracker by implicitly learning motion continuity from historical bounding box trajectories alone-without requiring additional, costly point cloud inputs. It first generates a fast, explicit motion proposal and then uses an implicit motion modeling module to predict the future trajectory, which in turn refines and corrects the initial proposal. Extensive experiments on the large-scale NuScenes benchmark show that TrajTrack achieves new state-of-the-art performance, dramatically improving tracking precision by 4.48% over a strong baseline while running at 56 FPS. Besides, we also demonstrate the strong generalizability of TrajTrack across different base trackers. Video is available at https://www.bilibili.com/video/BV1ahYgzmEWP.

Ссылки и действия