Pretrained Diffusion Models Are Inherently Skipped-Step Samplers

2508.15233v1 cs.CV, cs.LG 2025-08-23
Авторы:

Wenju Xu

Резюме на русском

## Контекст Одним из основных требований по системам generative AI является эффективность в процессе вывода, которая является ключевым фактором в сфере генерирования высококачественных графических изображений и текстов. Одна из ведущих технологий, достигшей лидирующих результатов, является diffusion models. Однако, они обладают значительным недостатком: требуются значительное количество последовательных шагов для сгенерированного объекта, что замедляет процесс и может привести к потере качества. Для улучшения этой ситуации ранее представлены методы, такие как DDIM, которые были предложены для сокращения шагов процесса, но они не являются частью стандартного подхода в diffusion models. В этой работе рассматривается возможность использовать технологии skipped-step sampling, которые позволяют ускорить процесс, не прибегая к изменению сути логики построения модели. ## Метод Авторы предлагают метод, называемый skipped-step sampling, который позволяет применять более эффективный шаблон вывода в процессе генерации. Основная характеристика этого метода заключается в том, что он не требует изменения логики, принципов или архитектуры стандартных diffusion models. Метод построен на основе того, что можно было бы пропустить некоторые шаги в процессе генерации, минуя их напрямую, благодаря использованию оптимизированных процессов. Это происходит благодаря тому, что модель diffusion может использовать Markovian properties для получения того же результата с меньшим числом шагов. Этот подход не требует изменений в самой модели и может быть реализован в соответствии с существующим контекстом. ## Результаты Результаты экспериментов показали, что skipped-step sampling позволяет значительно сократить число шагов, необходимых для генерации высококачественных объектов. Эксперименты проводились на популярных моделях, таких как OpenAI ADM, Stable Diffusion, и Open Sora. Использовавшаяся база данных включала различные типы графических изображений и текстов, а результаты показали, что для заданий, которые ранее требовали 100+ шагов, можно было получить тот же результат с помощью лишь 10-20 шагов, не уменьшая качества. Эта эффективность демонстрирует силу того, что skipped-step sampling может быть применено в различных сценариях для ускорения процессов генерации. ## Значимость Предложенный подход имеет широкие возможности для применения в сферах, где требуется быстрая и точная генерация высококачественных изображений и текстов. Например, в сфере creative AI, где требуется быстрое генерирование изображений для конкретных задач, подобный подход может существенно сократить время генерации. Благодаря повышению эффективности, это может позволить вносить более своевременные и точные вклады в сферу комп

Abstract

Diffusion models have been achieving state-of-the-art results across various generation tasks. However, a notable drawback is their sequential generation process, requiring long-sequence step-by-step generation. Existing methods, such as DDIM, attempt to reduce sampling steps by constructing a class of non-Markovian diffusion processes that maintain the same training objective. However, there remains a gap in understanding whether the original diffusion process can achieve the same efficiency without resorting to non-Markovian processes. In this paper, we provide a confirmative answer and introduce skipped-step sampling, a mechanism that bypasses multiple intermediate denoising steps in the iterative generation process, in contrast with the traditional step-by-step refinement of standard diffusion inference. Crucially, we demonstrate that this skipped-step sampling mechanism is derived from the same training objective as the standard diffusion model, indicating that accelerated sampling via skipped-step sampling via a Markovian way is an intrinsic property of pretrained diffusion models. Additionally, we propose an enhanced generation method by integrating our accelerated sampling technique with DDIM. Extensive experiments on popular pretrained diffusion models, including the OpenAI ADM, Stable Diffusion, and Open Sora models, show that our method achieves high-quality generation with significantly reduced sampling steps.

Ссылки и действия