IndiaWeatherBench: A Dataset and Benchmark for Data-Driven Regional Weather Forecasting over India
2509.00653v1
cs.LG, cs.AI, physics.ao-ph
2025-09-05
Авторы:
Tung Nguyen, Harkanwar Singh, Nilay Naharas, Lucas Bandarkar, Aditya Grover
Резюме на русском
## Контекст
Региональное прогнозирование погоды является критическим аспектом для локализованной адаптации к климату, минимизации интенсивности стихийных бедствий и устойчивого развития. Хотя машинное обучение продемонстрировало впечатляющие успехи в глобальном прогнозировании погоды, его применение к региональному прогнозированию до сих пор остается значительно недооцененным. Многие ранее проведенные исследования использовали различные наборы данных и экспериментальные настройки, что существенно ограничивало возможности честной сравнительной оценки и повторяемости результатов. Мы предлагаем **IndiaWeatherBench**, комплексный бенчмарк для данных, нацеленный на региональное прогнозирование погоды в Индии. Этот бенчмарк включает в себя крупномасштабный набор данных, созданный на базе высокорезолюционных региональных реанализов, а также набор метрик, обеспечивающий точный и последовательный анализ для обеспечения целостной оценки моделей. Мы также реализовываем и оцениваем различные модели, включая U-Nets, Transformers и Graph-based сети, с различными стратегиями условий границ и обучаемыми целями. Хотя наша работа фокусируется на Индии, **IndiaWeatherBench** легко может быть адаптирован для других регионов. Мы открыто распространяем все данные, реализации моделей и этапы оценки, чтобы способствовать продвижению исследований в этой области.
## Метод
Мы строим **IndiaWeatherBench** на основе высокорезолюционных реанализов, используя данные набора ERA5 и CHIRPS. Набор данных содержит меры погодных параметров, таких как температура, влажность, скорость ветра и метеорологические характеристики на разных уровнях, от периода до 1 часа до месяца. Чтобы обеспечить преемственность и последовательность, мы вводим метрики для оценки качества прогнозов, включая детерминистические (такие как MAE, RMSE) и пробоадистические (такие как PIT, CRPS). Для моделей мы используем широкий спектр архитектур, включая U-Net, Transformer и Graph-based сети, поскольку эти модели доказали свою эффективность в прогнозировании погоды. Мы также применяем различные стратегии условий и целевые функции, такие как разные граничные условия и целевые метрики (например, Mean Squared Error и Log-Cosh Loss). Мы определяем основные этапы процесса обучения и тестирования, чтобы обеспечить последовательность и четкость в экспериментах. Этот подход позволяет сравнить модели в условиях неизменных условий и поддерживать реплицируемость исследований.
## Результаты
Мы проводим эксперименты с различными моделями на нашем наборе данных. Мы проверяем U-Net, Transformer и Graph-based модели, а также разные условия границ и целевые функции. Для каждой модели мы сравниваем результаты с по
Abstract
Regional weather forecasting is a critical problem for localized climate
adaptation, disaster mitigation, and sustainable development. While machine
learning has shown impressive progress in global weather forecasting, regional
forecasting remains comparatively underexplored. Existing efforts often use
different datasets and experimental setups, limiting fair comparison and
reproducibility. We introduce IndiaWeatherBench, a comprehensive benchmark for
data-driven regional weather forecasting focused on the Indian subcontinent.
IndiaWeatherBench provides a curated dataset built from high-resolution
regional reanalysis products, along with a suite of deterministic and
probabilistic metrics to facilitate consistent training and evaluation. To
establish strong baselines, we implement and evaluate a range of models across
diverse architectures, including UNets, Transformers, and Graph-based networks,
as well as different boundary conditioning strategies and training objectives.
While focused on India, IndiaWeatherBench is easily extensible to other
geographic regions. We open-source all raw and preprocessed datasets, model
implementations, and evaluation pipelines to promote accessibility and future
development. We hope IndiaWeatherBench will serve as a foundation for advancing
regional weather forecasting research. Code is available at
https://github.com/tung-nd/IndiaWeatherBench.