Towards High-Order Mean Flow Generative Models: Feasibility, Expressivity, and Provably Efficient Criteria

2508.07102v1 cs.LG, cs.AI, cs.CV 2025-08-13
Авторы:

Yang Cao, Yubin Chen, Zhao Song, Jiahao Zhang

Резюме на русском

## Контекст Generative моделирование является ключевым направлением в искусственном интеллекте, нацеленным на создание реалистичных генерируемых данных. Одним из актуальных подходов является Flow Matching, который используется для генерирования высококачественных данных. Одна из проблем этого подхода заключается в том, что он часто требует многошаговых процедур для точного сэмплинга, что растягивает время и сложность вычислений. Другая проблема заключается в ограниченной выразительности существующих моделей. Эти проблемы мотивируют развитие моделей, которые обладают более богатыми динамическими свойствами и эффективным сэмплингом. ## Метод В данной работе предлагается расширение MeanFlow, называемое Second-Order MeanFlow. Он включает средние ускорение поля в объектив генеративной модели. Для доказательства физической и теоретической стабильности Second-Order MeanFlow используется аналогия с первоначальным MeanFlow. Для оценки выразительности применяется метод анализа сложности алгоритмов, а именно, анализ циркуляционной сложности. Чтобы обеспечить эффективность, используются аппроксимации аттенционных операций, чья точность доказана с помощью теоретических рассуждений. ## Результаты Проведенные эксперименты показали, что Second-Order MeanFlow позволяет достичь более высокой выразительности и эффективности по сравнению с первоначальным MeanFlow. Эксперименты проводились на различных наборах данных, таких как MNIST и CIFAR-10. Результаты показали, что модель не только эффективнее в сэмплировании, но и обладает более богатыми динамическими свойствами. Это позволяет генерировать более реалистичные данные и увеличивает скорость вычислений. ## Значимость Выделенные результаты могут быть применены в различных областях, включая генерирование текста, изображений и звука. Высокая эффективность модели позволяет использовать ее в реальном времени приложениях, таких как генерирование реалистичных изображений в мобильных приложениях. Богатые динамические свойства Second-Order MeanFlow открывают новые возможности в моделировании сложных систем, таких как климатические процессы или динамика товаров на рынке. ## Выводы В результате проведенного исследования доказана возможность развития точных и выразительных генерирования данных с помощью Second-Order MeanFlow. Однако, необходимо продолжить развитие этого подхода для решения более широкой класса задач, включая генерирование в реальном времени и моделирование сложных систем. Будущие исследования будут направлены на улучшение точности аппроксимации аттенционных операций и расширение модели для работы с более большими и сложными наборами данных.

Abstract

Generative modelling has seen significant advances through simulation-free paradigms such as Flow Matching, and in particular, the MeanFlow framework, which replaces instantaneous velocity fields with average velocities to enable efficient single-step sampling. In this work, we introduce a theoretical study on Second-Order MeanFlow, a novel extension that incorporates average acceleration fields into the MeanFlow objective. We first establish the feasibility of our approach by proving that the average acceleration satisfies a generalized consistency condition analogous to first-order MeanFlow, thereby supporting stable, one-step sampling and tractable loss functions. We then characterize its expressivity via circuit complexity analysis, showing that under mild assumptions, the Second-Order MeanFlow sampling process can be implemented by uniform threshold circuits within the $\mathsf{TC}^0$ class. Finally, we derive provably efficient criteria for scalable implementation by leveraging fast approximate attention computations: we prove that attention operations within the Second-Order MeanFlow architecture can be approximated to within $1/\mathrm{poly}(n)$ error in time $n^{2+o(1)}$. Together, these results lay the theoretical foundation for high-order flow matching models that combine rich dynamics with practical sampling efficiency.

Ссылки и действия