MoWE : A Mixture of Weather Experts

2509.09052v1 cs.LG, cs.AI, physics.ao-ph, physics.geo-ph 2025-09-13
Авторы:

Dibyajyoti Chakraborty, Romit Maulik, Peter Harrington, Dallas Foster, Mohammad Amin Nabian, Sanjay Choudhry

Резюме на русском

#### Контекст Область метеорологии находится в устойчивом развитии, с целью предоставлять точные прогнозы погоды для различных областей применения. Несмотря на недавнюю успешность искусственного интеллекта в повышении точности прогнозов погоды, прогресс в этой области начинает гаснуть. Основной проблемой является необходимость значительных вычислительных ресурсов для обучения индивидуальных моделей, а также ограничения в их развитии. Мотивация для этого исследования лежит в развитии новых подходов, позволяющих объединять выгоды множества существующих моделей для повышения эффективности и точности прогноза. #### Метод Предлагаемый подход, **Mixture of Weather Experts (MoWE)**, основывается на современных архитектурах Vision Transformer. Он использует гатейнг-сеть для динамического слияния выходов нескольких "экспертных" моделей погоды. Эта сеть учитывает не только входные данные, но также информацию о проблемных зонах и географической локализации. Таким образом, MoWE создает синтезированный прогноз, который синхронизирует вклады каждой модели на каждой точке сетки, производя оптимальный выбор в зависимости от глубины прогноза. Этот подход краткосрочным и длительным прогнозам позволяет избежать проблем с оптимизацией всех моделей. #### Результаты Эксперименты проведены на наборах данных последнего поколения, включая **ERA5** и **NCEP CFSv2**. Модель была сравнена с лучшими высокоточными прогнозирующими моделями погоды, такими как **HRES** и **ICON**. MoWE показала снижение **RMSE** до **10%** в прогнозе на два дня по сравнению с лучшей моделью и достигла до 20% лучшего результата по сравнению с простой средней моделей. Этот результат достигнут без дополнительных вычислительных затрат, что демонстрирует эффективность архитектуры MoWE в сжатии информации и её оптимальном использовании. #### Значимость Модель MoWE может использоваться в различных областях, таких как земледелие, энергетика и транспорт, где точные прогнозы погоды критичны. Она предлагает высокую эффективность, сочетая в себе выгоды лучших моделей без необходимости их дублирования или полного обучения заново. Это не только экономит вычислительные ресурсы, но и позволяет развивать прогностическую модель, не прибегая к новым моделям или алгоритмам. #### Выводы Результаты MoWE показывают, что этот подход является эффективным, экономичным и мощным для повышения точности прогнозов погоды. Будущие исследования будут сфокусированы на расширении модели для длительных прогнозов и её применении в глобальных масштабах. Этот подход может стать ключевым фактором в создании нового стандарта для автоматизированных прогнозов погоды, обеспе

Abstract

Data-driven weather models have recently achieved state-of-the-art performance, yet progress has plateaued in recent years. This paper introduces a Mixture of Experts (MoWE) approach as a novel paradigm to overcome these limitations, not by creating a new forecaster, but by optimally combining the outputs of existing models. The MoWE model is trained with significantly lower computational resources than the individual experts. Our model employs a Vision Transformer-based gating network that dynamically learns to weight the contributions of multiple "expert" models at each grid point, conditioned on forecast lead time. This approach creates a synthesized deterministic forecast that is more accurate than any individual component in terms of Root Mean Squared Error (RMSE). Our results demonstrate the effectiveness of this method, achieving up to a 10% lower RMSE than the best-performing AI weather model on a 2-day forecast horizon, significantly outperforming individual experts as well as a simple average across experts. This work presents a computationally efficient and scalable strategy to push the state of the art in data-driven weather prediction by making the most out of leading high-quality forecast models.

Ссылки и действия