Quantum Reinforcement Learning-Guided Diffusion Model for Image Synthesis via Hybrid Quantum-Classical Generative Model Architectures

2509.14163v1 quant-ph, cs.LG 2025-09-19
Авторы:

Chi-Sheng Chen, En-Jui Kuo

Резюме на русском

Опубликовано в соответствии с запросом. ## Контекст Диффузионные модели являются одними из самых эффективных подходов к генерированию изображений, основываясь на последовательном декодировании шума для создания реалистичных изображений. Однако, классические диффузионные модели часто используют статические или жирующие гибридные гидравлические гидродинамические схемы, которые не могут адаптироваться к изменениям шума и шага декодирования. Это приводит к ухудшению качества генерированных изображений и ограниченной гибкости. Для решения этой проблемы необходимо развить динамическую систему, которая могла бы анализировать и корректировать ситуацию в реальном времени, учитывая индивидуальные особенности каждого шага декодирования. Мотивация заключается в улучшении качества генерированных изображений, увеличении гибкости и эффективности диффузионных моделей, а также в повышении уровня адаптивности и точности системы в условиях различных условий шума и шага декодирования. ## Метод Для решения данной проблемы предложена динамическая система, основанная на квантовом гибридном архитектуре, которая включает в себя квантовый контроллер для динамического регулирования классификатора-бесплатного гида. Этот контроллер имеет актор-критик архитектуру, включая неглубокий шаблон вариационного квантового схемы (VQC) с кольцевой связью для порождения политик, а также классическую критическую систему для оценки функций ценности. Функции политики генерируются в виде гауссовых действий над параметрами диффузии, а критическая система оценивает возможности действий. Оптимизация проводится с помощью метода Proximal Policy Optimization (PPO) с учетом гибридной реализации Generalized Advantage Estimation (GAE). Модель оптимизируется с учетом трех основных факторов: улучшения классификации, качества перцепции и регулирования действий. ## Результаты Эксперименты проводились на датасете CIFAR-10. Результаты показали, что динамическая система с квантовым контроллером значительно улучшила качество генерированных изображений по таким показателям, как LPIPS, PSNR и SSIM, в сравнении с классическими моделями и статическими гибридными схемами. Благодаря динамической корректировке CFG во время декодирования, модель достигла высокой точности и регулярности. Кроме того, модель показала улучшение эффективности за счет снижения количества параметров в сравнении с классическими архитектурами. Таким образом, диффузионная модель с квантовым контроллером позволяет получить более качественные изображения, уменьшив нак

Abstract

Diffusion models typically employ static or heuristic classifier-free guidance (CFG) schedules, which often fail to adapt across timesteps and noise conditions. In this work, we introduce a quantum reinforcement learning (QRL) controller that dynamically adjusts CFG at each denoising step. The controller adopts a hybrid quantum--classical actor--critic architecture: a shallow variational quantum circuit (VQC) with ring entanglement generates policy features, which are mapped by a compact multilayer perceptron (MLP) into Gaussian actions over $\Delta$CFG, while a classical critic estimates value functions. The policy is optimized using Proximal Policy Optimization (PPO) with Generalized Advantage Estimation (GAE), guided by a reward that balances classification confidence, perceptual improvement, and action regularization. Experiments on CIFAR-10 demonstrate that our QRL policy improves perceptual quality (LPIPS, PSNR, SSIM) while reducing parameter count compared to classical RL actors and fixed schedules. Ablation studies on qubit number and circuit depth reveal trade-offs between accuracy and efficiency, and extended evaluations confirm robust generation under long diffusion schedules.

Ссылки и действия