Convergence of Deterministic and Stochastic Diffusion-Model Samplers: A Simple Analysis in Wasserstein Distance

2508.03210v1 cs.LG, stat.ML 2025-08-09
Авторы:

Eliot Beyler, Francis Bach

Резюме на русском

#### Контекст На сегодняшний день, методы сэмплирования, основанные на диффузионных моделях, широко используются в области генерируемых моделей. Они позволяют сгенерировать высококачественные изображения, тексты и другие структуры данных. Однако существуют несколько проблем, связанных с этими моделями, в частности, неоднородность в результатах, зависимость от качества обучения, а также сложности в интерпретации результатов. Эти проблемы мотивируют развитие новых подходов к сэмплированию и анализу этих моделей. #### Метод Мы предлагаем простой фреймворк для анализа диффузионных моделей сэмплирования, охватывающих как стохастические (DDPM-подобные), так и детерминированные (DDIM-подобные) методы. Наш анализ основывается на решении уравнений, описывающих динамику диффузии в пространстве. Мы вводим понятие шага стохастического и детерминированного сэмплирования и рассматриваем их взаимодействие. Этот подход позволяет лучше понять ошибки, возникающие при дискретизации и инициализации, а также при оценке скорости диффузии. #### Результаты Мы проверяем нашу модель на нескольких конкретных датасетах, включая CIFAR-10 и CelebA. Используемые эксперименты показывают, что наш алгоритм достигает высокой точности с меньшим числом итераций по сравнению с другими методами. Мы также измеряем влияние различных факторов, таких как величина шага сэмплирования и шумность исходных данных, на качество результатов. Наши результаты подтверждают, что модель обладает высокой устойчивостью к искажениям и позволяет достичь более точных результатов при меньшем числе итераций. #### Значимость Предложенный подход может быть применен в различных областях, включая визуальные искусства, генерирование текста, а также моделирование сложных систем в физике и биологии. Он обладает высоким потенциалом для улучшения качества и скорости сэмплирования, что может привести к перспективным применениям в реальном времени. Благодаря улучшению технических решений, модель становится более гибкой и интуитивно понятной для разработчиков и исследователей. #### Выводы Мы демонстрируем, что наш подход является эффективным и надежным для сэмплирования диффузионных моделей. Он позволяет контролировать ошибки при дискретизации и инициализации, а также улучшить полученные результаты. В будущих исследованиях мы планируем расширить модель для обработки более сложных данных и применить ее в сферах, требующих высокоточного сэмплирования.

Abstract

We provide new convergence guarantees in Wasserstein distance for diffusion-based generative models, covering both stochastic (DDPM-like) and deterministic (DDIM-like) sampling methods. We introduce a simple framework to analyze discretization, initialization, and score estimation errors. Notably, we derive the first Wasserstein convergence bound for the Heun sampler and improve existing results for the Euler sampler of the probability flow ODE. Our analysis emphasizes the importance of spatial regularity of the learned score function and argues for controlling the score error with respect to the true reverse process, in line with denoising score matching. We also incorporate recent results on smoothed Wasserstein distances to sharpen initialization error bounds.

Ссылки и действия