MoWE : A Mixture of Weather Experts
2509.09052v1
cs.LG, cs.AI, physics.ao-ph, physics.geo-ph
2025-09-13
Авторы:
Dibyajyoti Chakraborty, Romit Maulik, Peter Harrington, Dallas Foster, Mohammad Amin Nabian, Sanjay Choudhry
Резюме на русском
#### Контекст
Область метеорологии находится в устойчивом развитии, с целью предоставлять точные прогнозы погоды для различных областей применения. Несмотря на недавнюю успешность искусственного интеллекта в повышении точности прогнозов погоды, прогресс в этой области начинает гаснуть. Основной проблемой является необходимость значительных вычислительных ресурсов для обучения индивидуальных моделей, а также ограничения в их развитии. Мотивация для этого исследования лежит в развитии новых подходов, позволяющих объединять выгоды множества существующих моделей для повышения эффективности и точности прогноза.
#### Метод
Предлагаемый подход, **Mixture of Weather Experts (MoWE)**, основывается на современных архитектурах Vision Transformer. Он использует гатейнг-сеть для динамического слияния выходов нескольких "экспертных" моделей погоды. Эта сеть учитывает не только входные данные, но также информацию о проблемных зонах и географической локализации. Таким образом, MoWE создает синтезированный прогноз, который синхронизирует вклады каждой модели на каждой точке сетки, производя оптимальный выбор в зависимости от глубины прогноза. Этот подход краткосрочным и длительным прогнозам позволяет избежать проблем с оптимизацией всех моделей.
#### Результаты
Эксперименты проведены на наборах данных последнего поколения, включая **ERA5** и **NCEP CFSv2**. Модель была сравнена с лучшими высокоточными прогнозирующими моделями погоды, такими как **HRES** и **ICON**. MoWE показала снижение **RMSE** до **10%** в прогнозе на два дня по сравнению с лучшей моделью и достигла до 20% лучшего результата по сравнению с простой средней моделей. Этот результат достигнут без дополнительных вычислительных затрат, что демонстрирует эффективность архитектуры MoWE в сжатии информации и её оптимальном использовании.
#### Значимость
Модель MoWE может использоваться в различных областях, таких как земледелие, энергетика и транспорт, где точные прогнозы погоды критичны. Она предлагает высокую эффективность, сочетая в себе выгоды лучших моделей без необходимости их дублирования или полного обучения заново. Это не только экономит вычислительные ресурсы, но и позволяет развивать прогностическую модель, не прибегая к новым моделям или алгоритмам.
#### Выводы
Результаты MoWE показывают, что этот подход является эффективным, экономичным и мощным для повышения точности прогнозов погоды. Будущие исследования будут сфокусированы на расширении модели для длительных прогнозов и её применении в глобальных масштабах. Этот подход может стать ключевым фактором в создании нового стандарта для автоматизированных прогнозов погоды, обеспе
Abstract
Data-driven weather models have recently achieved state-of-the-art
performance, yet progress has plateaued in recent years. This paper introduces
a Mixture of Experts (MoWE) approach as a novel paradigm to overcome these
limitations, not by creating a new forecaster, but by optimally combining the
outputs of existing models. The MoWE model is trained with significantly lower
computational resources than the individual experts. Our model employs a Vision
Transformer-based gating network that dynamically learns to weight the
contributions of multiple "expert" models at each grid point, conditioned on
forecast lead time. This approach creates a synthesized deterministic forecast
that is more accurate than any individual component in terms of Root Mean
Squared Error (RMSE). Our results demonstrate the effectiveness of this method,
achieving up to a 10% lower RMSE than the best-performing AI weather model on a
2-day forecast horizon, significantly outperforming individual experts as well
as a simple average across experts. This work presents a computationally
efficient and scalable strategy to push the state of the art in data-driven
weather prediction by making the most out of leading high-quality forecast
models.