Artificial neural networks ensemble methodology to predict significant wave height
2509.14020v1
physics.ao-ph, cs.LG, physics.data-an, 68T07, 86A05, 68T05, I.2.6; J.2; G.3
2025-09-19
Авторы:
Felipe Crivellaro Minuzzi, Leandro Farina
Резюме на русском
#### Контекст
Прогнозирование волновых параметров, в том числе значимой высоты волн (Significant Wave Height, SWH), является ключевой задачей для многих приложений, зависящих от точного описания состояния океана. Несмотря на прогрессы в технических и вычислительных технологиях, прогнозирование сильных волн продолжает представлять сложности, возникающими из-за катастрофического характера океанового движения и относительной сложности математических моделей. Обычно решение этой задачи осуществляется с помощью различных моделей и многопараметрических стратегий, включая вариации инициальных условий и ансамблирование результатов. В последние годы роль машинного обучения (ML) усилилась, так как высокопроизводительные вычислительные системы стали доступнее. Машинное обучение применяется как альтернативные модели к традиционным методам, порой превосходя их в точности и эффективности. Наша работа основывается на построении ансамбля нейронных сетей для прогноза SWH в шести различных точках на берегу Бразилии.
#### Метод
Методология проектирует ансамбль из нескольких архитектур нейронных сетей, включая Многослойный перцептрон (MLP), Рекуррентную нейронную сеть (RNN), Длительностно-рекуррентную нейронную сеть (LSTM), Конволюционную нейронную сеть (CNN) и гибридную CNN-LSTM. Эти сети обучаются на данных NOAA (National Oceanic and Atmospheric Administration) с использованием синтетических задач регрессии. Целевая переменная — разница между выходами номинальной модели и наблюдаемыми данными. Мы предложили новую стратегию подготовки данных, включающую в себя извлечение изолированных сегментов данных для каждого местоположения. Данные обработаны с использованием трюка с нормализацией и агрегацией. Эта стратегия позволяет оптимизировать обучение и достичь более высокой точности.
#### Результаты
Мы провели эксперименты на шести различных точках без привязки к методу ансамбля, чтобы оценить качество прогноза SWH. Эталонным является NOAA's numerical model, а результаты сравнивались по нескольким метрикам. Наш ансамбль показал среднюю точность $80\%$, с максимальным значением $88\%$, что соответствует сокращению ошибки в $5\%$ по сравнению с базовой моделью. Это достигнуто при значительном сокращении вычислительных затрат, что делает нашу модель эффективнее. Эти результаты указывают на мощность ансамбля для решения задачи прогноза SWH с повышенной точностью и экономичностью.
#### Значимость
Наш прогностический подход может быть использован в различных приложениях, включая мониторинг морского подъема, логистику, а также геологические исследования. Особенно важна его значи
Abstract
The forecast of wave variables are important for several applications that
depend on a better description of the ocean state. Due to the chaotic behaviour
of the differential equations which model this problem, a well know strategy to
overcome the difficulties is basically to run several simulations, by for
instance, varying the initial condition, and averaging the result of each of
these, creating an ensemble. Moreover, in the last few years, considering the
amount of available data and the computational power increase, machine learning
algorithms have been applied as surrogate to traditional numerical models,
yielding comparative or better results. In this work, we present a methodology
to create an ensemble of different artificial neural networks architectures,
namely, MLP, RNN, LSTM, CNN and a hybrid CNN-LSTM, which aims to predict
significant wave height on six different locations in the Brazilian coast. The
networks are trained using NOAA's numerical reforecast data and target the
residual between observational data and the numerical model output. A new
strategy to create the training and target datasets is demonstrated. Results
show that our framework is capable of producing high efficient forecast, with
an average accuracy of $80\%$, that can achieve up to $88\%$ in the best case
scenario, which means $5\%$ reduction in error metrics if compared to NOAA's
numerical model, and a increasingly reduction of computational cost.