Scale-Adaptive Generative Flows for Multiscale Scientific Data
2509.02971v1
stat.ML, cs.LG, cs.NA, math.NA, math.PR
2025-09-05
Авторы:
Yifan Chen, Eric Vanden-Eijnden
Резюме на русском
## Контекст
Многомерные данные в научных и прикладных задачах часто имеют сложные структуры и поведение в разных масштабах. Одной из основных проблем при моделировании таких данных является точность в подробных масштабах, которая часто страдает в силу ограниченности моделей. Задача построения эффективных генерирующих моделей для таких данных является важной, но до сих пор неудовлетворительно решаемой, особенно для сложных систем, например, систем физической неустойчивости, которые характеризуются многомерностью и многомерным динамическим поведением.
## Метод
Методология, предложенная в работе, основывается на возобновлении идеи генерирующих моделей на основе потоков, но с учетом многомасштабности данных. Авторы предлагают использовать спектрально соответствующие шумы (noise distributions), чтобы исключить значительные ошибки в подробных масштабах. Также предлагается усовершенствованный подход к интерполяции, который учитывает многомасштабность и неустойчивость данных. Технически, это осуществляется с помощью спектральной адаптации шумов и интерполяции, чтобы создать модели, которые могут успешно оперировать с данными в разных масштабах.
## Результаты
Авторы продемонстрировали свой подход на двух примерах: синтетических случайных полей и решениях кинетических уравнений. Результаты показывают, что использование шумов, соответствующих спектру данных, позволяет существенно повысить точность модели в подробных масштабах по сравнению с традиционными методами, такими как модели с белым шумом. Кроме того, новый подход демонстрирует значительное сокращение вычислительных затрат, не теряя в качестве результата.
## Значимость
Предложенный подход может быть применен в различных областях, включая моделирование физических систем, генерирование данных для симуляций и прикладное исследование сложных динамических систем. Этот подход предоставляет преимущества в том, что он не только повышает точность, но и сокращает вычислительные затраты, что важно для решения научных и прикладных задач. Эффективность и точность моделей могут иметь значительное влияние на развитие глубокого обучения в научных задачах.
## Выводы
Авторы успешно показали, что спектрально соответствующие модели могут эффективно сочетать точность и вычислительную эффективность в моделировании многомасштабных данных. Будущие исследования будут направлены на расширение этого подхода на более сложные системы и проверку его на реальных научных задачах.
Abstract
Flow-based generative models can face significant challenges when modeling
scientific data with multiscale Fourier spectra, often producing large errors
in fine-scale features. We address this problem within the framework of
stochastic interpolants, via principled design of noise distributions and
interpolation schedules. The key insight is that the noise should not be
smoother than the target data distribution -- measured by Fourier spectrum
decay rates -- to ensure bounded drift fields near the initial time. For
Gaussian and near-Gaussian distributions whose fine-scale structure is known,
we show that spectrum-matched noise improves numerical efficiency compared to
standard white-noise approaches. For complex non-Gaussian distributions, we
develop scale-adaptive interpolation schedules that address the numerical
ill-conditioning arising from rougher-than-data noise. Numerical experiments on
synthetic Gaussian random fields and solutions to the stochastic Allen-Cahn and
Navier-Stokes equations validate our approach and demonstrate its ability to
generate high-fidelity samples at lower computational cost than traditional
approaches.