Leveraging GNN to Enhance MEF Method in Predicting ENSO

2508.07410v1 physics.ao-ph, cs.AI, I.2.6 2025-08-13
Авторы:

Saghar Ganji, Mohammad Naisipour

Резюме на русском

## Контекст Предсказание Энсо (El Niño Southern Oscillation, ENSO) — одно из самых сложных заданий в климатической науке, так как этот климатический феномен влияет на значительное число метеорологических и экономических процессов в мире. Особенной сложностью является долгосрочное предсказание ENSO, поскольку это требует точных прогнозов на много месяцев вперед. Это задача значительно усложняется хаотичностью климатических процессов и громоздкостью многомодельных подходов. Одним из таких подходов является Multimodal ENSO Forecast (MEF), который использует двухмодульную архитектуру с 3D Convolutional Neural Network (3D-CNN) и модулем для последовательностей данных. Однако, существуют ряд ограничений в существующем подходе, в том числе неэффективное использование всего параллельно работающего парковочного агрегата и недостаточная учетная вероятность во взаимосвязи между членами парковочного агрегата. Этот факт мог привести к несостоятельности модели в долгосрочном прогнозировании. Это резюме рассматривает модель, которая использует графовые нейронные сети (GNN) для улучшения MEF в долгосрочных прогнозах ENSO. ## Метод Методология, предложенная в этой статье, использует графовую сеть для моделирования взаимосвязи 80 членов парковочного агрегата MEF. Каждый член парковочного агрегата — это выход отдельного модели MEF. В графе, вершины задаются выходами модели, а рёбра определяются мерой сходства, вычисляемой с помощью RMSE и корреляционной меры. Из этого графа будут выделяться кластеры взаимосвязанных и точных прогнозов. Метод оптимизирует выбор членов парковочного агрегата путем удаления шума и повышения взаимосвязи. Этот процесс преобразует множество 80 прогнозов в оптимальный подбор 20 прогнозов, которые используются для получения окончательного прогноза средним суммарным значением. Это новая стратегия позволяет улучшить прогнозную точность, убрав лишние шумы и повысив внутреннюю консистентность выбранных прогнозов. ## Результаты Проведенные эксперименты показали, что новый подход значимо улучшает прогнозную способность MEF, особенно в ситуациях сложного климатического воздействия, таких как долгосрочные прогнозы ENSO. Использование графовой сети для выбора 20 лучших прогнозов позволило улучшить надежность и точность прогноза, в то же время сократив вероятность получения неточных результатов. Однако, хотя новая модель не всегда превосходит оригинальную MEF, она демонстрирует более стабильное и консистентное поведение, особенно при долгосрочных прогнозах. Таким образом, новый подход дает возможность повысить уровень долгосрочного прог

Abstract

Reliable long-lead forecasting of the El Nino Southern Oscillation (ENSO) remains a long-standing challenge in climate science. The previously developed Multimodal ENSO Forecast (MEF) model uses 80 ensemble predictions by two independent deep learning modules: a 3D Convolutional Neural Network (3D-CNN) and a time-series module. In their approach, outputs of the two modules are combined using a weighting strategy wherein one is prioritized over the other as a function of global performance. Separate weighting or testing of individual ensemble members did not occur, however, which may have limited the model to optimize the use of high-performing but spread-out forecasts. In this study, we propose a better framework that employs graph-based analysis to directly model similarity between all 80 members of the ensemble. By constructing an undirected graph whose vertices are ensemble outputs and whose weights on edges measure similarity (via RMSE and correlation), we identify and cluster structurally similar and accurate predictions. From which we obtain an optimized subset of 20 members using community detection methods. The final prediction is then obtained by averaging this optimized subset. This method improves the forecast skill through noise removal and emphasis on ensemble coherence. Interestingly, our graph-based selection shows robust statistical characteristics among top performers, offering new ensemble behavior insights. In addition, we observe that while the GNN-based approach does not always outperform the baseline MEF under every scenario, it produces more stable and consistent outputs, particularly in compound long-lead situations. The approach is model-agnostic too, suggesting that it can be applied directly to other forecasting models with gargantuan ensemble outputs, such as statistical, physical, or hybrid models.

Ссылки и действия