FlowDet: Overcoming Perspective and Scale Challenges in Real-Time End-to-End Traffic Detection
2508.19565v1
cs.CV, cs.AI, I.4.8; I.2.10; I.5.1
2025-08-29
Авторы:
Yuhang Zhao, Zixing Wang
Резюме на русском
#### Контекст
Детекторы объектов с принципом end-to-end обработки (end-to-end object detectors) являются перспективным подходом в реальном времени для таких задач, как мониторинг трафика. Однако их высокий компьютерный затрат доминирует в сложных сценариях, таких как мониторинг трафика на перекрестках. Эти задачи требуют высокой эффективности и точности для обеспечения безопасности и эффективности транспортных систем. Несмотря на развитие технологий, возникают проблемы, такие как перспективные искажения и различия в масштабах объектов, которые затрудняют достижение высокой точности и производительности.
#### Метод
Мы предлагаем FlowDet — новый детектор, основанный на развитии DETR. Основные инновации FlowDet:
1. **Geometric Deformable Unit (GDU)**: Это модуль предназначен для обеспечения точного геометрического моделирования в трафике, учитывая детализацию и объектные формы.
2. **Scale-Aware Attention (SAA)**: Этот модуль обеспечивает поддержание высокой представительной силы при экстремальных разностях масштабов.
3. **Optimization Strategy**: Мы разделили оптимизацию кодировщика, что позволило значительно сократить вычислительные затраты.
Таким образом, FlowDet получил архитектуру, которая сочетает представительность с высокой эффективностью.
#### Результаты
Мы провели эксперименты на собственной коллекции данных Intersection-Flow-5k, интенсивно загруженной трафиком и охватывающей сложные сценарии. На этой выборке FlowDet демонстрирует лучшие результаты. Улучшения сравнивались с RT-DETR:
- **AP(test)** увеличилось на 1.5%,
- **AP50(test)** — на 1.6%,
- **GFLOPs** сократились на 63.2%,
- **инференсное время** увеличилось на 16.2%.
Такие результаты показывают, что FlowDet может обеспечить высокую точность при значительном сокращении ресурсоемкости, что важно для реального времени.
#### Значимость
Предлагаемый подход может быть применен в различных сценариях, где важно высокое качество детекции в режиме реального времени, например, в системах мониторинга трафика и автоматизированных систем транспорта. Улучшенная эффективность FlowDet позволяет использовать его в системах с ограниченным вычислительным мощностью, что делает его привлекательным для использования в транспортных системах и смарт-транспорте.
#### Выводы
FlowDet устанавливает новый стандарт для детектирования объектов в режиме реального времени, сочетая высокую точность и эффективность. Мы рассматриваем будущие исследования направленные на улучшение модели для обнаружения дополнительных факторов, таких как динамика движения и контекстуальная информация, чтобы еще больше повысить точность и реалистичность.
Abstract
End-to-end object detectors offer a promising NMS-free paradigm for real-time
applications, yet their high computational cost remains a significant barrier,
particularly for complex scenarios like intersection traffic monitoring. To
address this challenge, we propose FlowDet, a high-speed detector featuring a
decoupled encoder optimization strategy applied to the DETR architecture.
Specifically, FlowDet employs a novel Geometric Deformable Unit (GDU) for
traffic-aware geometric modeling and a Scale-Aware Attention (SAA) module to
maintain high representational power across extreme scale variations. To
rigorously evaluate the model's performance in environments with severe
occlusion and high object density, we collected the Intersection-Flow-5k
dataset, a new challenging scene for this task. Evaluated on
Intersection-Flow-5k, FlowDet establishes a new state-of-the-art. Compared to
the strong RT-DETR baseline, it improves AP(test) by 1.5% and AP50(test) by
1.6%, while simultaneously reducing GFLOPs by 63.2% and increasing inference
speed by 16.2%. Our work demonstrates a new path towards building highly
efficient and accurate detectors for demanding, real-world perception systems.
The Intersection-Flow-5k dataset is available at
https://github.com/AstronZh/Intersection-Flow-5K.