VAE-DNN: Energy-Efficient Trainable-by-Parts Surrogate Model For Parametric Partial Differential Equations
2508.03839v1
cs.LG, cs.AI, cs.CE, 68
2025-08-09
Авторы:
Yifei Zong, Alexandre M. Tartakovsky
Резюме на русском
Решение задач параметрических нелинейных уравнений в частных производных (ПДЕ) требует высокоэффективных и точных методов. В этой работе предлагается модель VAE-DNN, которая является тренируемой по частям суррогатной моделью для решения прямых и обратных задач. Она использует архитектуру вариативного автоэнкодера (VAE), состоящую из энкодера, полносвязной нейронной сети и декодера. Энкодер сжимает высокоразмерный вход $y(\bm{x})$ в латентное пространство $\bm\mu_{\bm\phi_y}$, затем нейросеть отображает его в пространство $\bm\mu_{\bm\phi_h}$ решения ПДЕ $h(\bm{x},t)$, которое восстанавливается декодером. Отдельная тренировка каждого компонента существенно сокращает время и энергию по сравнению с лидирующими моделями FNO и DeepONet. Исследования показывают, что VAE-DNN превосходит их по точности и эффективности в решении уравнений течения грунтовых вод.
Abstract
We propose a trainable-by-parts surrogate model for solving forward and
inverse parameterized nonlinear partial differential equations. Like several
other surrogate and operator learning models, the proposed approach employs an
encoder to reduce the high-dimensional input $y(\bm{x})$ to a lower-dimensional
latent space, $\bm\mu_{\bm\phi_y}$. Then, a fully connected neural network is
used to map $\bm\mu_{\bm\phi_y}$ to the latent space, $\bm\mu_{\bm\phi_h}$, of
the PDE solution $h(\bm{x},t)$. Finally, a decoder is utilized to reconstruct
$h(\bm{x},t)$. The innovative aspect of our model is its ability to train its
three components independently. This approach leads to a substantial decrease
in both the time and energy required for training when compared to leading
operator learning models such as FNO and DeepONet. The separable training is
achieved by training the encoder as part of the variational autoencoder (VAE)
for $y(\bm{x})$ and the decoder as part of the $h(\bm{x},t)$ VAE. We refer to
this model as the VAE-DNN model. VAE-DNN is compared to the FNO and DeepONet
models for obtaining forward and inverse solutions to the nonlinear diffusion
equation governing groundwater flow in an unconfined aquifer. Our findings
indicate that VAE-DNN not only demonstrates greater efficiency but also
delivers superior accuracy in both forward and inverse solutions compared to
the FNO and DeepONet models.