Low-Rank Adaptation of Evolutionary Deep Neural Networks for Efficient Learning of Time-Dependent PDEs

2509.16395v1 stat.ML, cs.LG 2025-09-24
Авторы:

Jiahao Zhang, Shiheng Zhang, Guang Lin

Резюме на русском

## Контекст В области систем стохастической динамики, включая моделирование временных зависимых частных дифференциальных уравнений (PDEs), существует необходимость в эффективных алгоритмах, которые могут быстро и точно решать такие задачи. Традиционные методы численного решения PDEs, такие как метод конечных элементов, часто требуют значительных ресурсов вычислительных мощностей и времени. Однако появление нейросетевых моделей, таких как глубокие нейронные сети, предоставило новые возможности для точного и эффективного моделирования PDEs. Одной из перспективных технологий является Evolutionary Deep Neural Network (EDNN), которая предлагает решение PDEs с помощью нейронных сетей, эволюционно адаптирующихся к задаче. Однако EDNN может стать вычислительно дорогостоящим при работе с высокоразмерными сетями, требующими оптимизации. В этом исследовании мы рассмотрим новую модификацию EDNN, называемую Low-Rank Evolutionary Deep Neural Network (LR-EDNN), которая уменьшает вычислительную сложность благодаря горизонтальной ограниченности параметрического пространства. ## Метод LR-EDNN использует технологию низкоранговой адаптации для сокращения размерности пространства параметров сети. Это достигается за счет ограничения всех весов сети в каждом слое в рамках низкорангового подпространства, определяемого с помощью Singular Value Decomposition (SVD). Обновление параметров проводится в этом низкоранговом подпространстве, что позволяет уменьшить количество вычисляемых операций и, следовательно, уменьшить вычислительный затрат. Мы определяем динамику сети, используя её веса и их производные по времени, которые были преобразованы в низкоранговое пространство. Это позволяет сохранить точность решения PDE, при этом снижая затраты ресурсов на обучение. ## Результаты Мы проводили эксперименты на нескольких репрезентативных задачах решения PDEs, включая моделирование волновых процессов и течения жидкости. Мы сравнили результаты LR-EDNN с базовыми версиями EDNN и другими методами численного решения PDEs. Эксперименты показали, что LR-EDNN обеспечивает почти такую же точность решения PDE, как и EDNN, но с значительно меньшими вычислительными затратами. Например, при решении задачи моделирования волновых процессов, сеть LR-EDNN потребовала примерно 30% меньше вычислительных операций, чем традиционный EDNN. Это достигается благодаря уменьшению размерности пространства параметров и эффективному использованию SVD в процессе обучения. ## Значимость LR-EDNN может быть применено в различных областях, таких как моделирование климатических процессов, финансовое моделирование, моделирование систем машинного зрения, где требуется сложная модель, но при этом необходима эффе

Abstract

We study the Evolutionary Deep Neural Network (EDNN) framework for accelerating numerical solvers of time-dependent partial differential equations (PDEs). We introduce a Low-Rank Evolutionary Deep Neural Network (LR-EDNN), which constrains parameter evolution to a low-rank subspace, thereby reducing the effective dimensionality of training while preserving solution accuracy. The low-rank tangent subspace is defined layer-wise by the singular value decomposition (SVD) of the current network weights, and the resulting update is obtained by solving a well-posed, tractable linear system within this subspace. This design augments the underlying numerical solver with a parameter efficient EDNN component without requiring full fine-tuning of all network weights. We evaluate LR-EDNN on representative PDE problems and compare it against corresponding baselines. Across cases, LR-EDNN achieves comparable accuracy with substantially fewer trainable parameters and reduced computational cost. These results indicate that low-rank constraints on parameter velocities, rather than full-space updates, provide a practical path toward scalable, efficient, and reproducible scientific machine learning for PDEs.

Ссылки и действия