Adaptive Vehicle Speed Classification via BMCNN with Reinforcement Learning-Enhanced Acoustic Processing

2509.00839v1 cs.SD, cs.AI, eess.AS 2025-09-05

Авторы:

Yuli Zhang, Pengfei Fan, Ruiyuan Jiang, Hankang Gu, Dongyao Jia, Xinheng Wang

Резюме на русском

## Контекст Движущиесясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясяя сокращения. Однако модели, основанные на глубоком обучении, часто требуют больших объемов вычислительных ресурсов, что ограничивает их применение в реальном времени. Нашим целью является разработка эффективного фреймворка, который способен обеспечить точность и быстроту обработки для реального времени применения в условиях разнообразных городских сред. ## Метод Мы предлагаем гибридную модель, которая объединяет глубокое обучение и усиленное обучение с подкреплением. Модель построена на основе двухразрядной BMCNN, которая обрабатывает две типовые компоненты акустических признаков: MFCC (Минимально Функциональные Характеристики Звука) и признаки волнового преобразования. Эти две компоненты обеспечивают разные частотные паттерны, которые вместе дают более полное представление о скорости транспортных средств. Для улучшения точности и скорости, мы внедрили в модель аннотационную сеть DQN (Дифференцируемая Квантовая Сеть), которая адаптивно выбирает минимальное количество аудио-фреймов для обработки и активирует раннюю оценку скорости, как только достигнут уровень достоверности. Это позволяет снизить время обработки без потери точности. ## Результаты Мы проверили нашу модель на двух выборках данных: IDMT-Traffic и SZUR-Acoustic (Suzhou). На IDMT-Traffic она достигла 95.99% точности, а на SZUR-Acoustic — 92.3%. Важно отметить, что на SZUR-Acoustic метод обеспечил скорость обработки до 1.63 раз выше, чем установленный значением усредненного показателя точности. Для сравнения, мы провели эксперименты с такими алгоритмами, как A3C, DDDQN, SA2C, PPO и TD3, и продемонстрировали, что наш метод обеспечивает более высокую точность при более эффективном использовании ресурсов. ## Значимость Наш алгоритм может быть применен в различных городских системах управления трафиком, таких как системы смарт-городов и адаптивных систем управления трафиком. Он предоставляет точную оценку скорости транспортных средств в реальном времени, каких требуются для эффективного управления городским трафиком. Благодаря своей высокой скорости и точности, мы открываем новые возможности для реального времени применения в тяжелой среде. ## Выводы Наши результаты показывают, что модель BMCNN с усиленным обучением с подкреплением обеспечивает высокую точность и эффективность решения задачи классификации скорости транспортных средств. Мы видим будущие направления исследований в развитии методов для обработки акустичес

Abstract

Traffic congestion remains a pressing urban challenge, requiring intelligent transportation systems for real-time management. We present a hybrid framework that combines deep learning and reinforcement learning for acoustic vehicle speed classification. A dual-branch BMCNN processes MFCC and wavelet features to capture complementary frequency patterns. An attention-enhanced DQN adaptively selects the minimal number of audio frames and triggers early decisions once confidence thresholds are reached. Evaluations on IDMT-Traffic and our SZUR-Acoustic (Suzhou) datasets show 95.99% and 92.3% accuracy, with up to 1.63x faster average processing via early termination. Compared with A3C, DDDQN, SA2C, PPO, and TD3, the method provides a superior accuracy-efficiency trade-off and is suitable for real-time ITS deployment in heterogeneous urban environments.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Adaptive Vehicle Speed Classification via BMCNN with Reinforcement Learning-Enhanced Acoustic Processing

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

RRPO: Robust Reward Policy Optimization for LLM-based Emotional TTS

Multi-Loss Learning for Speech Emotion Recognition with Energy-Adaptive Mixup an...

Multidimensional Music Aesthetic Evaluation via Semantically Consistent C-Mixup ...

Aligning Generative Music AI with Human Preferences: Methods and Challenges

Real-Time Speech Enhancement via a Hybrid ViT: A Dual-Input Acoustic-Image Featu...

Навигация