Flow Matching-Based Generative Modeling for Efficient and Scalable Data Assimilation

2508.13313v1 stat.ML, cs.LG, math.OC, 60G35 (Primary), 62M20 (Secondary), 93E11 2025-08-21
Авторы:

Taos Transue, Bohan Chen, So Takao, Bao Wang

Резюме на русском

################################# ## Контекст ################################# Данные ассимиляции (Data Assimilation, DA) — это проблема последовательного оценивания состояния динамической системы с использованием шумных наблюдений. Недавние достижения в области генерируемых моделей способствовали развитию новых подходов к решению DA в высокомерных нелинейных системах, в том числе на основе ensemble score filter (EnSF). Однако эти новые подходы связаны с высокой вычислительной нагрузкой из-за медленной создания выборок. В данной статье предлагается новый подход к фильтрации на основе flow matching (FM), который называется ensemble flow filter (EnFF). Этот метод ускоряет создание выборок и позволяет гибко проектировать векторные поля (VF). Он является тренировочной-бесплатной DA-методологией, интегрирующей оценочные методы Монте-Карло (MC) для маргинального векторного поля (VF) и локализованной наблюдательной навигации. EnFF обеспечивает более быструю фильтрацию и гибкость в проектировании VF по сравнению с другими подходами генерируемых моделей в DA. ################################# ## Метод ################################# Методом EnFF является фильтрация на основе flow matching (FM), который включает в себя оценочные методы Monte Carlo (MC) для маргинального векторного поля (VF) и локализованной навигации. Основной идеей является использование максимальной правдоподобности (maximum likelihood) для построения маргинального VF, используя данные Монте-Карло. Это позволяет сформировать векторное поле (VF) из нескольких подвыборок, чтобы улучшить возможности оценки генерируемых моделей. Архитектура EnFF также включает в себя локализованные шаги, которые улучшают возможности масштабирования, позволяя использовать большие модели с высоким разрешением. Метод EnFF является простым в реализации и не требует тренировки, что делает его эффективным для DA в высокомерных системах. ################################# ## Результаты ################################# В экспериментах, проведенных на высокомерных бенчмарках данных, EnFF продемонстрировал значительное улучшение в соотношении скорости/точности в сравнении с собственными подходами, такими как ensemble score filter (EnSF) и ensemble Kalman filter (EnKF). Использование больших моделей с высоким разрешением позволило EnFF использовать большие выборки во время фильтрации. Это также позволило улучшить точность фильтрации в высокомерных динамических системах. Эксперименты показывают, что EnFF может быть эффективно использован в высокомерных DA благодаря быстрому созданию выборок и гибкому проектированию VF. ################################# ## Значимость ################################# EnFF может быть применен в различных областях, например в моделировании климата, в экономике, в моделировании динамических систем. Он позволяет эффективно использовать большие выборки в DA, что улучшает точность и устойчивость моделей в высокомерных сист

Abstract

Data assimilation (DA) is the problem of sequentially estimating the state of a dynamical system from noisy observations. Recent advances in generative modeling have inspired new approaches to DA in high-dimensional nonlinear settings, especially the ensemble score filter (EnSF). However, these come at a significant computational burden due to slow sampling. In this paper, we introduce a new filtering framework based on flow matching (FM) -- called the ensemble flow filter (EnFF) -- to accelerate sampling and enable flexible design of probability paths. EnFF -- a training-free DA approach -- integrates MC estimators for the marginal FM vector field (VF) and a localized guidance to assimilate observations. EnFF has faster sampling and more flexibility in VF design compared to existing generative modeling for DA. Theoretically, we show that EnFF encompasses classical filtering methods such as the bootstrap particle filter and the ensemble Kalman filter as special cases. Experiments on high-dimensional filtering benchmarks demonstrate improved cost-accuracy tradeoffs and the ability to leverage larger ensembles than prior methods. Our results highlight the promise of FM as a scalable tool for filtering in high-dimensional applications that enable the use of large ensembles.

Ссылки и действия