IndiaWeatherBench: A Dataset and Benchmark for Data-Driven Regional Weather Forecasting over India

2509.00653v1 cs.LG, cs.AI, physics.ao-ph 2025-09-05
Авторы:

Tung Nguyen, Harkanwar Singh, Nilay Naharas, Lucas Bandarkar, Aditya Grover

Резюме на русском

## Контекст Региональное прогнозирование погоды является критическим аспектом для локализованной адаптации к климату, минимизации интенсивности стихийных бедствий и устойчивого развития. Хотя машинное обучение продемонстрировало впечатляющие успехи в глобальном прогнозировании погоды, его применение к региональному прогнозированию до сих пор остается значительно недооцененным. Многие ранее проведенные исследования использовали различные наборы данных и экспериментальные настройки, что существенно ограничивало возможности честной сравнительной оценки и повторяемости результатов. Мы предлагаем **IndiaWeatherBench**, комплексный бенчмарк для данных, нацеленный на региональное прогнозирование погоды в Индии. Этот бенчмарк включает в себя крупномасштабный набор данных, созданный на базе высокорезолюционных региональных реанализов, а также набор метрик, обеспечивающий точный и последовательный анализ для обеспечения целостной оценки моделей. Мы также реализовываем и оцениваем различные модели, включая U-Nets, Transformers и Graph-based сети, с различными стратегиями условий границ и обучаемыми целями. Хотя наша работа фокусируется на Индии, **IndiaWeatherBench** легко может быть адаптирован для других регионов. Мы открыто распространяем все данные, реализации моделей и этапы оценки, чтобы способствовать продвижению исследований в этой области. ## Метод Мы строим **IndiaWeatherBench** на основе высокорезолюционных реанализов, используя данные набора ERA5 и CHIRPS. Набор данных содержит меры погодных параметров, таких как температура, влажность, скорость ветра и метеорологические характеристики на разных уровнях, от периода до 1 часа до месяца. Чтобы обеспечить преемственность и последовательность, мы вводим метрики для оценки качества прогнозов, включая детерминистические (такие как MAE, RMSE) и пробоадистические (такие как PIT, CRPS). Для моделей мы используем широкий спектр архитектур, включая U-Net, Transformer и Graph-based сети, поскольку эти модели доказали свою эффективность в прогнозировании погоды. Мы также применяем различные стратегии условий и целевые функции, такие как разные граничные условия и целевые метрики (например, Mean Squared Error и Log-Cosh Loss). Мы определяем основные этапы процесса обучения и тестирования, чтобы обеспечить последовательность и четкость в экспериментах. Этот подход позволяет сравнить модели в условиях неизменных условий и поддерживать реплицируемость исследований. ## Результаты Мы проводим эксперименты с различными моделями на нашем наборе данных. Мы проверяем U-Net, Transformer и Graph-based модели, а также разные условия границ и целевые функции. Для каждой модели мы сравниваем результаты с по

Abstract

Regional weather forecasting is a critical problem for localized climate adaptation, disaster mitigation, and sustainable development. While machine learning has shown impressive progress in global weather forecasting, regional forecasting remains comparatively underexplored. Existing efforts often use different datasets and experimental setups, limiting fair comparison and reproducibility. We introduce IndiaWeatherBench, a comprehensive benchmark for data-driven regional weather forecasting focused on the Indian subcontinent. IndiaWeatherBench provides a curated dataset built from high-resolution regional reanalysis products, along with a suite of deterministic and probabilistic metrics to facilitate consistent training and evaluation. To establish strong baselines, we implement and evaluate a range of models across diverse architectures, including UNets, Transformers, and Graph-based networks, as well as different boundary conditioning strategies and training objectives. While focused on India, IndiaWeatherBench is easily extensible to other geographic regions. We open-source all raw and preprocessed datasets, model implementations, and evaluation pipelines to promote accessibility and future development. We hope IndiaWeatherBench will serve as a foundation for advancing regional weather forecasting research. Code is available at https://github.com/tung-nd/IndiaWeatherBench.

Ссылки и действия

Связанные статьи

AT Loss: Advanced Torrential Loss Function for Precipitation Forecasting

## Контекст Прогнозирование мощности осадков приобретает всё большее значение в контексте изменения климата. Обычные ме...

2025-09-05