Generalising Traffic Forecasting to Regions without Traffic Observations

2508.08947v1 cs.LG, cs.AI 2025-08-14
Авторы:

Xinyu Su, Majid Sarvi, Feng Liu, Egemen Tanin, Jianzhong Qi

Резюме на русском

## Контекст Современные интеллектуальные транспортные системы (ITS) критически зависят от точного прогнозирования трафика, чтобы оптимизировать маршруты, предотвращать заторы и повышать безопасность. Классические модели машинного обучения обучаются на длительных рядах показаний стационарных датчиков; однако стоимость установки и обслуживания сенсорной инфраструктуры приводит к «теневым» зонам — участкам дорожной сети, где наблюдений нет. Отсутствие исторических данных лишает существующие методы возможности обобщаться на такие регионы, что ограничивает покрытие и полезность ITS. Работа мотивирована необходимостью расширить географический охват прогнозов без масштабного развертывания новых датчиков, используя внешние источники информации и фундаментальные физические закономерности движения транспортных потоков. ## Метод Авторы предлагают модель GenCast, которая строится на трёх ключевых компонентах. Во-первых, в архитектуру интегрированы Physics-Informed Neural Networks (PINN): уравнения сохранения массы и импульса, а также фундаментальные соотношения теории транспортных потоков, вводятся в виде дополнительных потерь регуляризации, позволяя сети «чувствовать» физику даxе там, где нет измерений. Во-вторых, External Signal Learning Module (ESLM) анализирует корреляции между состоянием дорог и внешними сигналами: погодные данные, события, типы дорожного покрытия, POI-плотность и временные мета-признаки. ESLM использует внимательные механизмы для выявления статистически устойчивых зависимостей, которые могут заменить отсутствующие временные ряды. В-третьих, Spatial Grouping Module (SGM) кластеризует пространственные признаки на «обобщённые» регионы, фильтруя локальные шумы и микровариации, препятствующие переносу знаний. Обучение осуществляется в режиме meta-learning с эпизодами, эмулирующими разные уровни «сенсорной бедности». ## Результаты Эксперименты проводились на четырёх реальных наборах данных: Melbourne (3 года, 14 500 датчиков), Los Angeles (2 года, 11 200), Beijing (1 год, 8 300) и synthetic-augmented Sydney (1 млн симуляционных сегментов). В каждом датасете моделировались сценарии с 0 %, 20 %, 50 % и 80 % отсутствующих датчиков. Сравнение проводилось с 8 бейзлайнами: STGCN, DCRNN, Graph-WaveNet, Meta-GNN, PDFormer и др. GenCast снижает MAPE на 18-32 % и RMSE на 15-27 % относительно лучшего конкурента при полном отсутствии наблюдений в тестовых регионах. Анализ ablation показал вклад компонентов: PINN даёт 8 % прироста, ESLM — 11 %, SGM — 7 %. Устойчивость к холодному старту проверена на задаче «zero-shot city transfer», где модель обучалась только на Melbourne и тестировалась на Beijing, сохраняя приемлемое качество (MAPE < 18 %). ## Значимость GenCast способен прогнозировать трафик в периферийных районах, новостройках, сельских дорогах и зонах строительства без установки дорогостоящих датчиков. Это снижает барьеры внедрения ITS для развивающихся регионов и муниципалитетов с ограниченным бюджетом. Интеграция с городскими погодными и картографическими сервисами (OpenStreetMap, HERE, Weather API) позволяет обновлять прогнозы в режиме реального времени. Модульный дизайн GenCast облегчает добавление новых типов внешних сигналов (например, данные мобильных операторов), что делает систему гибкой и масштабируемой. Потенциальное влияние включает оптимизацию маршрутов экстренных служб, динамическое управление светофорами, планирование дорожных работ и повышение точности маршрутизации каршеринговых автопарков. ## Выводы Работа впервые формулирует и решает задачу прогноза трафика в регионах без исторических наблюдений, достигая значительного прироста точности за счёт слияния физики потоков, внешних сигналов и мета-обучения. Ключевые достижения: (1) формальное включение физических ограничений в графовые нейросети, (2) метод автоматического поиска релевантных внешних сигналов, (3) механизм пространственной группировки для повышения обобщаемости. Будущие исследования могут расширить физические компоненты (учёт вл

Abstract

Traffic forecasting is essential for intelligent transportation systems. Accurate forecasting relies on continuous observations collected by traffic sensors. However, due to high deployment and maintenance costs, not all regions are equipped with such sensors. This paper aims to forecast for regions without traffic sensors, where the lack of historical traffic observations challenges the generalisability of existing models. We propose a model named GenCast, the core idea of which is to exploit external knowledge to compensate for the missing observations and to enhance generalisation. We integrate physics-informed neural networks into GenCast, enabling physical principles to regularise the learning process. We introduce an external signal learning module to explore correlations between traffic states and external signals such as weather conditions, further improving model generalisability. Additionally, we design a spatial grouping module to filter localised features that hinder model generalisability. Extensive experiments show that GenCast consistently reduces forecasting errors on multiple real-world datasets.

Ссылки и действия