Pretrained Diffusion Models Are Inherently Skipped-Step Samplers
2508.15233v1
cs.CV, cs.LG
2025-08-23
Авторы:
Wenju Xu
Резюме на русском
## Контекст
Одним из основных требований по системам generative AI является эффективность в процессе вывода, которая является ключевым фактором в сфере генерирования высококачественных графических изображений и текстов. Одна из ведущих технологий, достигшей лидирующих результатов, является diffusion models. Однако, они обладают значительным недостатком: требуются значительное количество последовательных шагов для сгенерированного объекта, что замедляет процесс и может привести к потере качества. Для улучшения этой ситуации ранее представлены методы, такие как DDIM, которые были предложены для сокращения шагов процесса, но они не являются частью стандартного подхода в diffusion models. В этой работе рассматривается возможность использовать технологии skipped-step sampling, которые позволяют ускорить процесс, не прибегая к изменению сути логики построения модели.
## Метод
Авторы предлагают метод, называемый skipped-step sampling, который позволяет применять более эффективный шаблон вывода в процессе генерации. Основная характеристика этого метода заключается в том, что он не требует изменения логики, принципов или архитектуры стандартных diffusion models. Метод построен на основе того, что можно было бы пропустить некоторые шаги в процессе генерации, минуя их напрямую, благодаря использованию оптимизированных процессов. Это происходит благодаря тому, что модель diffusion может использовать Markovian properties для получения того же результата с меньшим числом шагов. Этот подход не требует изменений в самой модели и может быть реализован в соответствии с существующим контекстом.
## Результаты
Результаты экспериментов показали, что skipped-step sampling позволяет значительно сократить число шагов, необходимых для генерации высококачественных объектов. Эксперименты проводились на популярных моделях, таких как OpenAI ADM, Stable Diffusion, и Open Sora. Использовавшаяся база данных включала различные типы графических изображений и текстов, а результаты показали, что для заданий, которые ранее требовали 100+ шагов, можно было получить тот же результат с помощью лишь 10-20 шагов, не уменьшая качества. Эта эффективность демонстрирует силу того, что skipped-step sampling может быть применено в различных сценариях для ускорения процессов генерации.
## Значимость
Предложенный подход имеет широкие возможности для применения в сферах, где требуется быстрая и точная генерация высококачественных изображений и текстов. Например, в сфере creative AI, где требуется быстрое генерирование изображений для конкретных задач, подобный подход может существенно сократить время генерации. Благодаря повышению эффективности, это может позволить вносить более своевременные и точные вклады в сферу комп
Abstract
Diffusion models have been achieving state-of-the-art results across various
generation tasks. However, a notable drawback is their sequential generation
process, requiring long-sequence step-by-step generation. Existing methods,
such as DDIM, attempt to reduce sampling steps by constructing a class of
non-Markovian diffusion processes that maintain the same training objective.
However, there remains a gap in understanding whether the original diffusion
process can achieve the same efficiency without resorting to non-Markovian
processes. In this paper, we provide a confirmative answer and introduce
skipped-step sampling, a mechanism that bypasses multiple intermediate
denoising steps in the iterative generation process, in contrast with the
traditional step-by-step refinement of standard diffusion inference. Crucially,
we demonstrate that this skipped-step sampling mechanism is derived from the
same training objective as the standard diffusion model, indicating that
accelerated sampling via skipped-step sampling via a Markovian way is an
intrinsic property of pretrained diffusion models. Additionally, we propose an
enhanced generation method by integrating our accelerated sampling technique
with DDIM. Extensive experiments on popular pretrained diffusion models,
including the OpenAI ADM, Stable Diffusion, and Open Sora models, show that our
method achieves high-quality generation with significantly reduced sampling
steps.
Ссылки и действия
Дополнительные ресурсы: