Breaking Through Barren Plateaus: Reinforcement Learning Initializations for Deep Variational Quantum Circuits

2508.18514v1 cs.LG, quant-ph 2025-08-28
Авторы:

Yifeng Peng, Xinyi Li, Zhemin Zhang, Samuel Yen-Chi Chen, Zhiding Liang, Ying Wang

Резюме на русском

## Контекст Variational Quantum Algorithms (VQAs) являются мощным инструментом для решения задач, включая оптимизацию, синтез веществ и машинное обучение на ближайших к реальности квантовых устройствах. Однако, эффективность VQAs ограничена проблемой "баренных равнин" (barren plateaus), когда градиенты становятся малыми в сопоставлении с оптимизируемой функцией, что приводит к сложностям в тренировке моделей. Данная проблема становится все более релевантной с ростом размера и глубины квантовых схем. Наша мотивация заключается в разработке метода, который позволит избежать "баренных равнин" и улучшить эффективность тренировки VQAs. ## Метод Мы предлагаем использовать методы машинного обучения, а именно, реинфорсированное обучение (Reinforcement Learning, RL) для инициализации весов в VQAs. Мы тренируем RL-агента для генерирования начальных параметров схемы, которые минимизируют целевую функцию VQAs. Агент использует различные алгоритмы RL, такие как Deterministic Policy Gradient, Soft Actor-Critic и Proximal Policy Optimization, для генерации начальных весов. Эти начальные параметры позволяют алгоритмам оптимизации, таким как градиентный спуск (gradient descent) и Adam, начинать работу с более выгодного положения, избегая "баренных равнин". ## Результаты Мы провести подробные эксперименты для оценки эффективности нашего подхода. Данные для экспериментов были подготовлены с использованием различных задач, включая оптимизацию и синтез веществ. Мы измерили время тренировки, точность решения и затраты ресурсов. Результаты показали, что наш подход существенно улучшает скорость сходимости и точность решения в сравнении с традиционными методами инициализации. Мы также сравнили различные алгоритмы RL и показали, что они дают похожие результаты, что демонстрирует гибкость и устойчивость нашего подхода. ## Значимость Наш метод может быть применен в различных областях, включая оптимизацию, синтез химических соединений и машинное обучение. Он обеспечивает существенное улучшение производительности VQAs, что ведет к более быстрой и точной тренировке моделей. Это делает наш подход ключевым инструментом для устранения проблемы "баренных равнин" в квантовых вычислениях. Будущие исследования будут сфокусированы на расширении этого подхода для более сложных задач и исследовании возможности интеграции с другими методами машинного обучения. ## Выводы Мы предложили новый метод инициализации параметров в VQAs, основанный на реинфорсированном обучении, что позволил устранить проблему "баренных равнин" и улучшить производительность тренировки моделей. Эксперименты показали существенные позитивные результаты в скорост

Abstract

Variational Quantum Algorithms (VQAs) have gained prominence as a viable framework for exploiting near-term quantum devices in applications ranging from optimization and chemistry simulation to machine learning. However, the effectiveness of VQAs is often constrained by the so-called barren plateau problem, wherein gradients diminish exponentially as system size or circuit depth increases, thereby hindering training. In this work, we propose a reinforcement learning (RL)-based initialization strategy to alleviate the barren plateau issue by reshaping the initial parameter landscape to avoid regions prone to vanishing gradients. In particular, we explore several RL algorithms (Deterministic Policy Gradient, Soft Actor-Critic, and Proximal Policy Optimization, etc.) to generate the circuit parameters (treated as actions) that minimize the VQAs cost function before standard gradient-based optimization. By pre-training with RL in this manner, subsequent optimization using methods such as gradient descent or Adam proceeds from a more favorable initial state. Extensive numerical experiments under various noise conditions and tasks consistently demonstrate that the RL-based initialization method significantly enhances both convergence speed and final solution quality. Moreover, comparisons among different RL algorithms highlight that multiple approaches can achieve comparable performance gains, underscoring the flexibility and robustness of our method. These findings shed light on a promising avenue for integrating machine learning techniques into quantum algorithm design, offering insights into how RL-driven parameter initialization can accelerate the scalability and practical deployment of VQAs. Opening up a promising path for the research community in machine learning for quantum, especially barren plateau problems in VQAs.

Ссылки и действия