Low-Rank Adaptation of Evolutionary Deep Neural Networks for Efficient Learning of Time-Dependent PDEs
2509.16395v1
stat.ML, cs.LG
2025-09-24
Авторы:
Jiahao Zhang, Shiheng Zhang, Guang Lin
Резюме на русском
## Контекст
В области систем стохастической динамики, включая моделирование временных зависимых частных дифференциальных уравнений (PDEs), существует необходимость в эффективных алгоритмах, которые могут быстро и точно решать такие задачи. Традиционные методы численного решения PDEs, такие как метод конечных элементов, часто требуют значительных ресурсов вычислительных мощностей и времени. Однако появление нейросетевых моделей, таких как глубокие нейронные сети, предоставило новые возможности для точного и эффективного моделирования PDEs. Одной из перспективных технологий является Evolutionary Deep Neural Network (EDNN), которая предлагает решение PDEs с помощью нейронных сетей, эволюционно адаптирующихся к задаче. Однако EDNN может стать вычислительно дорогостоящим при работе с высокоразмерными сетями, требующими оптимизации. В этом исследовании мы рассмотрим новую модификацию EDNN, называемую Low-Rank Evolutionary Deep Neural Network (LR-EDNN), которая уменьшает вычислительную сложность благодаря горизонтальной ограниченности параметрического пространства.
## Метод
LR-EDNN использует технологию низкоранговой адаптации для сокращения размерности пространства параметров сети. Это достигается за счет ограничения всех весов сети в каждом слое в рамках низкорангового подпространства, определяемого с помощью Singular Value Decomposition (SVD). Обновление параметров проводится в этом низкоранговом подпространстве, что позволяет уменьшить количество вычисляемых операций и, следовательно, уменьшить вычислительный затрат. Мы определяем динамику сети, используя её веса и их производные по времени, которые были преобразованы в низкоранговое пространство. Это позволяет сохранить точность решения PDE, при этом снижая затраты ресурсов на обучение.
## Результаты
Мы проводили эксперименты на нескольких репрезентативных задачах решения PDEs, включая моделирование волновых процессов и течения жидкости. Мы сравнили результаты LR-EDNN с базовыми версиями EDNN и другими методами численного решения PDEs. Эксперименты показали, что LR-EDNN обеспечивает почти такую же точность решения PDE, как и EDNN, но с значительно меньшими вычислительными затратами. Например, при решении задачи моделирования волновых процессов, сеть LR-EDNN потребовала примерно 30% меньше вычислительных операций, чем традиционный EDNN. Это достигается благодаря уменьшению размерности пространства параметров и эффективному использованию SVD в процессе обучения.
## Значимость
LR-EDNN может быть применено в различных областях, таких как моделирование климатических процессов, финансовое моделирование, моделирование систем машинного зрения, где требуется сложная модель, но при этом необходима эффе
Abstract
We study the Evolutionary Deep Neural Network (EDNN) framework for
accelerating numerical solvers of time-dependent partial differential equations
(PDEs). We introduce a Low-Rank Evolutionary Deep Neural Network (LR-EDNN),
which constrains parameter evolution to a low-rank subspace, thereby reducing
the effective dimensionality of training while preserving solution accuracy.
The low-rank tangent subspace is defined layer-wise by the singular value
decomposition (SVD) of the current network weights, and the resulting update is
obtained by solving a well-posed, tractable linear system within this subspace.
This design augments the underlying numerical solver with a parameter efficient
EDNN component without requiring full fine-tuning of all network weights. We
evaluate LR-EDNN on representative PDE problems and compare it against
corresponding baselines. Across cases, LR-EDNN achieves comparable accuracy
with substantially fewer trainable parameters and reduced computational cost.
These results indicate that low-rank constraints on parameter velocities,
rather than full-space updates, provide a practical path toward scalable,
efficient, and reproducible scientific machine learning for PDEs.
Ссылки и действия
Дополнительные ресурсы: