Adaptive Vehicle Speed Classification via BMCNN with Reinforcement Learning-Enhanced Acoustic Processing
2509.00839v1
cs.SD, cs.AI, eess.AS
2025-09-05
Авторы:
Yuli Zhang, Pengfei Fan, Ruiyuan Jiang, Hankang Gu, Dongyao Jia, Xinheng Wang
Резюме на русском
## Контекст
Движущиесясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясясяя
сокращения. Однако модели, основанные на глубоком обучении, часто требуют больших объемов вычислительных ресурсов, что
ограничивает их применение в реальном времени. Нашим целью является разработка эффективного фреймворка, который
способен обеспечить точность и быстроту обработки для реального времени применения в условиях разнообразных городских
сред.
## Метод
Мы предлагаем гибридную модель, которая объединяет глубокое обучение и усиленное обучение с подкреплением. Модель
построена на основе двухразрядной BMCNN, которая обрабатывает две типовые компоненты акустических признаков: MFCC (Минимально
Функциональные Характеристики Звука) и признаки волнового преобразования. Эти две компоненты обеспечивают разные
частотные паттерны, которые вместе дают более полное представление о скорости транспортных средств. Для улучшения
точности и скорости, мы внедрили в модель аннотационную сеть DQN (Дифференцируемая Квантовая Сеть), которая
адаптивно выбирает минимальное количество аудио-фреймов для обработки и активирует раннюю оценку скорости, как только
достигнут уровень достоверности. Это позволяет снизить время обработки без потери точности.
## Результаты
Мы проверили нашу модель на двух выборках данных: IDMT-Traffic и SZUR-Acoustic (Suzhou). На IDMT-Traffic она достигла
95.99% точности, а на SZUR-Acoustic — 92.3%. Важно отметить, что на SZUR-Acoustic метод обеспечил скорость обработки
до 1.63 раз выше, чем установленный значением усредненного показателя точности. Для сравнения, мы провели эксперименты
с такими алгоритмами, как A3C, DDDQN, SA2C, PPO и TD3, и продемонстрировали, что наш метод обеспечивает более высокую
точность при более эффективном использовании ресурсов.
## Значимость
Наш алгоритм может быть применен в различных городских системах управления трафиком, таких как системы смарт-городов и
адаптивных систем управления трафиком. Он предоставляет точную оценку скорости транспортных средств в реальном времени,
каких требуются для эффективного управления городским трафиком. Благодаря своей высокой скорости и точности, мы
открываем новые возможности для реального времени применения в тяжелой среде.
## Выводы
Наши результаты показывают, что модель BMCNN с усиленным обучением с подкреплением обеспечивает высокую точность и эффективность
решения задачи классификации скорости транспортных средств. Мы видим будущие направления исследований в развитии
методов для обработки акустичес
Abstract
Traffic congestion remains a pressing urban challenge, requiring intelligent
transportation systems for real-time management. We present a hybrid framework
that combines deep learning and reinforcement learning for acoustic vehicle
speed classification. A dual-branch BMCNN processes MFCC and wavelet features
to capture complementary frequency patterns. An attention-enhanced DQN
adaptively selects the minimal number of audio frames and triggers early
decisions once confidence thresholds are reached. Evaluations on IDMT-Traffic
and our SZUR-Acoustic (Suzhou) datasets show 95.99% and 92.3% accuracy, with up
to 1.63x faster average processing via early termination. Compared with A3C,
DDDQN, SA2C, PPO, and TD3, the method provides a superior accuracy-efficiency
trade-off and is suitable for real-time ITS deployment in heterogeneous urban
environments.
Ссылки и действия
Дополнительные ресурсы: