Scale-Adaptive Generative Flows for Multiscale Scientific Data

2509.02971v1 stat.ML, cs.LG, cs.NA, math.NA, math.PR 2025-09-05
Авторы:

Yifan Chen, Eric Vanden-Eijnden

Резюме на русском

## Контекст Многомерные данные в научных и прикладных задачах часто имеют сложные структуры и поведение в разных масштабах. Одной из основных проблем при моделировании таких данных является точность в подробных масштабах, которая часто страдает в силу ограниченности моделей. Задача построения эффективных генерирующих моделей для таких данных является важной, но до сих пор неудовлетворительно решаемой, особенно для сложных систем, например, систем физической неустойчивости, которые характеризуются многомерностью и многомерным динамическим поведением. ## Метод Методология, предложенная в работе, основывается на возобновлении идеи генерирующих моделей на основе потоков, но с учетом многомасштабности данных. Авторы предлагают использовать спектрально соответствующие шумы (noise distributions), чтобы исключить значительные ошибки в подробных масштабах. Также предлагается усовершенствованный подход к интерполяции, который учитывает многомасштабность и неустойчивость данных. Технически, это осуществляется с помощью спектральной адаптации шумов и интерполяции, чтобы создать модели, которые могут успешно оперировать с данными в разных масштабах. ## Результаты Авторы продемонстрировали свой подход на двух примерах: синтетических случайных полей и решениях кинетических уравнений. Результаты показывают, что использование шумов, соответствующих спектру данных, позволяет существенно повысить точность модели в подробных масштабах по сравнению с традиционными методами, такими как модели с белым шумом. Кроме того, новый подход демонстрирует значительное сокращение вычислительных затрат, не теряя в качестве результата. ## Значимость Предложенный подход может быть применен в различных областях, включая моделирование физических систем, генерирование данных для симуляций и прикладное исследование сложных динамических систем. Этот подход предоставляет преимущества в том, что он не только повышает точность, но и сокращает вычислительные затраты, что важно для решения научных и прикладных задач. Эффективность и точность моделей могут иметь значительное влияние на развитие глубокого обучения в научных задачах. ## Выводы Авторы успешно показали, что спектрально соответствующие модели могут эффективно сочетать точность и вычислительную эффективность в моделировании многомасштабных данных. Будущие исследования будут направлены на расширение этого подхода на более сложные системы и проверку его на реальных научных задачах.

Abstract

Flow-based generative models can face significant challenges when modeling scientific data with multiscale Fourier spectra, often producing large errors in fine-scale features. We address this problem within the framework of stochastic interpolants, via principled design of noise distributions and interpolation schedules. The key insight is that the noise should not be smoother than the target data distribution -- measured by Fourier spectrum decay rates -- to ensure bounded drift fields near the initial time. For Gaussian and near-Gaussian distributions whose fine-scale structure is known, we show that spectrum-matched noise improves numerical efficiency compared to standard white-noise approaches. For complex non-Gaussian distributions, we develop scale-adaptive interpolation schedules that address the numerical ill-conditioning arising from rougher-than-data noise. Numerical experiments on synthetic Gaussian random fields and solutions to the stochastic Allen-Cahn and Navier-Stokes equations validate our approach and demonstrate its ability to generate high-fidelity samples at lower computational cost than traditional approaches.

Ссылки и действия