Leveraging GNN to Enhance MEF Method in Predicting ENSO
2508.07410v1
physics.ao-ph, cs.AI, I.2.6
2025-08-13
Авторы:
Saghar Ganji, Mohammad Naisipour
Резюме на русском
## Контекст
Предсказание Энсо (El Niño Southern Oscillation, ENSO) — одно из самых сложных заданий в климатической науке, так как этот климатический феномен влияет на значительное число метеорологических и экономических процессов в мире. Особенной сложностью является долгосрочное предсказание ENSO, поскольку это требует точных прогнозов на много месяцев вперед. Это задача значительно усложняется хаотичностью климатических процессов и громоздкостью многомодельных подходов. Одним из таких подходов является Multimodal ENSO Forecast (MEF), который использует двухмодульную архитектуру с 3D Convolutional Neural Network (3D-CNN) и модулем для последовательностей данных. Однако, существуют ряд ограничений в существующем подходе, в том числе неэффективное использование всего параллельно работающего парковочного агрегата и недостаточная учетная вероятность во взаимосвязи между членами парковочного агрегата. Этот факт мог привести к несостоятельности модели в долгосрочном прогнозировании. Это резюме рассматривает модель, которая использует графовые нейронные сети (GNN) для улучшения MEF в долгосрочных прогнозах ENSO.
## Метод
Методология, предложенная в этой статье, использует графовую сеть для моделирования взаимосвязи 80 членов парковочного агрегата MEF. Каждый член парковочного агрегата — это выход отдельного модели MEF. В графе, вершины задаются выходами модели, а рёбра определяются мерой сходства, вычисляемой с помощью RMSE и корреляционной меры. Из этого графа будут выделяться кластеры взаимосвязанных и точных прогнозов. Метод оптимизирует выбор членов парковочного агрегата путем удаления шума и повышения взаимосвязи. Этот процесс преобразует множество 80 прогнозов в оптимальный подбор 20 прогнозов, которые используются для получения окончательного прогноза средним суммарным значением. Это новая стратегия позволяет улучшить прогнозную точность, убрав лишние шумы и повысив внутреннюю консистентность выбранных прогнозов.
## Результаты
Проведенные эксперименты показали, что новый подход значимо улучшает прогнозную способность MEF, особенно в ситуациях сложного климатического воздействия, таких как долгосрочные прогнозы ENSO. Использование графовой сети для выбора 20 лучших прогнозов позволило улучшить надежность и точность прогноза, в то же время сократив вероятность получения неточных результатов. Однако, хотя новая модель не всегда превосходит оригинальную MEF, она демонстрирует более стабильное и консистентное поведение, особенно при долгосрочных прогнозах. Таким образом, новый подход дает возможность повысить уровень долгосрочного прог
Abstract
Reliable long-lead forecasting of the El Nino Southern Oscillation (ENSO)
remains a long-standing challenge in climate science. The previously developed
Multimodal ENSO Forecast (MEF) model uses 80 ensemble predictions by two
independent deep learning modules: a 3D Convolutional Neural Network (3D-CNN)
and a time-series module. In their approach, outputs of the two modules are
combined using a weighting strategy wherein one is prioritized over the other
as a function of global performance. Separate weighting or testing of
individual ensemble members did not occur, however, which may have limited the
model to optimize the use of high-performing but spread-out forecasts. In this
study, we propose a better framework that employs graph-based analysis to
directly model similarity between all 80 members of the ensemble. By
constructing an undirected graph whose vertices are ensemble outputs and whose
weights on edges measure similarity (via RMSE and correlation), we identify and
cluster structurally similar and accurate predictions. From which we obtain an
optimized subset of 20 members using community detection methods. The final
prediction is then obtained by averaging this optimized subset. This method
improves the forecast skill through noise removal and emphasis on ensemble
coherence. Interestingly, our graph-based selection shows robust statistical
characteristics among top performers, offering new ensemble behavior insights.
In addition, we observe that while the GNN-based approach does not always
outperform the baseline MEF under every scenario, it produces more stable and
consistent outputs, particularly in compound long-lead situations. The approach
is model-agnostic too, suggesting that it can be applied directly to other
forecasting models with gargantuan ensemble outputs, such as statistical,
physical, or hybrid models.