Artificial neural networks ensemble methodology to predict significant wave height

2509.14020v1 physics.ao-ph, cs.LG, physics.data-an, 68T07, 86A05, 68T05, I.2.6; J.2; G.3 2025-09-19
Авторы:

Felipe Crivellaro Minuzzi, Leandro Farina

Резюме на русском

#### Контекст Прогнозирование волновых параметров, в том числе значимой высоты волн (Significant Wave Height, SWH), является ключевой задачей для многих приложений, зависящих от точного описания состояния океана. Несмотря на прогрессы в технических и вычислительных технологиях, прогнозирование сильных волн продолжает представлять сложности, возникающими из-за катастрофического характера океанового движения и относительной сложности математических моделей. Обычно решение этой задачи осуществляется с помощью различных моделей и многопараметрических стратегий, включая вариации инициальных условий и ансамблирование результатов. В последние годы роль машинного обучения (ML) усилилась, так как высокопроизводительные вычислительные системы стали доступнее. Машинное обучение применяется как альтернативные модели к традиционным методам, порой превосходя их в точности и эффективности. Наша работа основывается на построении ансамбля нейронных сетей для прогноза SWH в шести различных точках на берегу Бразилии. #### Метод Методология проектирует ансамбль из нескольких архитектур нейронных сетей, включая Многослойный перцептрон (MLP), Рекуррентную нейронную сеть (RNN), Длительностно-рекуррентную нейронную сеть (LSTM), Конволюционную нейронную сеть (CNN) и гибридную CNN-LSTM. Эти сети обучаются на данных NOAA (National Oceanic and Atmospheric Administration) с использованием синтетических задач регрессии. Целевая переменная — разница между выходами номинальной модели и наблюдаемыми данными. Мы предложили новую стратегию подготовки данных, включающую в себя извлечение изолированных сегментов данных для каждого местоположения. Данные обработаны с использованием трюка с нормализацией и агрегацией. Эта стратегия позволяет оптимизировать обучение и достичь более высокой точности. #### Результаты Мы провели эксперименты на шести различных точках без привязки к методу ансамбля, чтобы оценить качество прогноза SWH. Эталонным является NOAA's numerical model, а результаты сравнивались по нескольким метрикам. Наш ансамбль показал среднюю точность $80\%$, с максимальным значением $88\%$, что соответствует сокращению ошибки в $5\%$ по сравнению с базовой моделью. Это достигнуто при значительном сокращении вычислительных затрат, что делает нашу модель эффективнее. Эти результаты указывают на мощность ансамбля для решения задачи прогноза SWH с повышенной точностью и экономичностью. #### Значимость Наш прогностический подход может быть использован в различных приложениях, включая мониторинг морского подъема, логистику, а также геологические исследования. Особенно важна его значи

Abstract

The forecast of wave variables are important for several applications that depend on a better description of the ocean state. Due to the chaotic behaviour of the differential equations which model this problem, a well know strategy to overcome the difficulties is basically to run several simulations, by for instance, varying the initial condition, and averaging the result of each of these, creating an ensemble. Moreover, in the last few years, considering the amount of available data and the computational power increase, machine learning algorithms have been applied as surrogate to traditional numerical models, yielding comparative or better results. In this work, we present a methodology to create an ensemble of different artificial neural networks architectures, namely, MLP, RNN, LSTM, CNN and a hybrid CNN-LSTM, which aims to predict significant wave height on six different locations in the Brazilian coast. The networks are trained using NOAA's numerical reforecast data and target the residual between observational data and the numerical model output. A new strategy to create the training and target datasets is demonstrated. Results show that our framework is capable of producing high efficient forecast, with an average accuracy of $80\%$, that can achieve up to $88\%$ in the best case scenario, which means $5\%$ reduction in error metrics if compared to NOAA's numerical model, and a increasingly reduction of computational cost.

Ссылки и действия