Quantum Reinforcement Learning-Guided Diffusion Model for Image Synthesis via Hybrid Quantum-Classical Generative Model Architectures
2509.14163v1
quant-ph, cs.LG
2025-09-19
Авторы:
Chi-Sheng Chen, En-Jui Kuo
Резюме на русском
Опубликовано в соответствии с запросом.
## Контекст
Диффузионные модели являются одними из самых эффективных подходов к генерированию изображений, основываясь на последовательном декодировании шума для создания реалистичных изображений. Однако, классические диффузионные модели часто используют статические или жирующие гибридные гидравлические гидродинамические схемы, которые не могут адаптироваться к изменениям шума и шага декодирования. Это приводит к ухудшению качества генерированных изображений и ограниченной гибкости. Для решения этой проблемы необходимо развить динамическую систему, которая могла бы анализировать и корректировать ситуацию в реальном времени, учитывая индивидуальные особенности каждого шага декодирования. Мотивация заключается в улучшении качества генерированных изображений, увеличении гибкости и эффективности диффузионных моделей, а также в повышении уровня адаптивности и точности системы в условиях различных условий шума и шага декодирования.
## Метод
Для решения данной проблемы предложена динамическая система, основанная на квантовом гибридном архитектуре, которая включает в себя квантовый контроллер для динамического регулирования классификатора-бесплатного гида. Этот контроллер имеет актор-критик архитектуру, включая неглубокий шаблон вариационного квантового схемы (VQC) с кольцевой связью для порождения политик, а также классическую критическую систему для оценки функций ценности. Функции политики генерируются в виде гауссовых действий над параметрами диффузии, а критическая система оценивает возможности действий. Оптимизация проводится с помощью метода Proximal Policy Optimization (PPO) с учетом гибридной реализации Generalized Advantage Estimation (GAE). Модель оптимизируется с учетом трех основных факторов: улучшения классификации, качества перцепции и регулирования действий.
## Результаты
Эксперименты проводились на датасете CIFAR-10. Результаты показали, что динамическая система с квантовым контроллером значительно улучшила качество генерированных изображений по таким показателям, как LPIPS, PSNR и SSIM, в сравнении с классическими моделями и статическими гибридными схемами. Благодаря динамической корректировке CFG во время декодирования, модель достигла высокой точности и регулярности. Кроме того, модель показала улучшение эффективности за счет снижения количества параметров в сравнении с классическими архитектурами. Таким образом, диффузионная модель с квантовым контроллером позволяет получить более качественные изображения, уменьшив нак
Abstract
Diffusion models typically employ static or heuristic classifier-free
guidance (CFG) schedules, which often fail to adapt across timesteps and noise
conditions. In this work, we introduce a quantum reinforcement learning (QRL)
controller that dynamically adjusts CFG at each denoising step. The controller
adopts a hybrid quantum--classical actor--critic architecture: a shallow
variational quantum circuit (VQC) with ring entanglement generates policy
features, which are mapped by a compact multilayer perceptron (MLP) into
Gaussian actions over $\Delta$CFG, while a classical critic estimates value
functions. The policy is optimized using Proximal Policy Optimization (PPO)
with Generalized Advantage Estimation (GAE), guided by a reward that balances
classification confidence, perceptual improvement, and action regularization.
Experiments on CIFAR-10 demonstrate that our QRL policy improves perceptual
quality (LPIPS, PSNR, SSIM) while reducing parameter count compared to
classical RL actors and fixed schedules. Ablation studies on qubit number and
circuit depth reveal trade-offs between accuracy and efficiency, and extended
evaluations confirm robust generation under long diffusion schedules.
Ссылки и действия
Дополнительные ресурсы: