Comparison of D-Wave Quantum Annealing and Markov Chain Monte Carlo for Sampling from a Probability Distribution of a Restricted Boltzmann Machine
2508.10228v2
cs.LG, quant-ph, stat.ML
2025-08-18
Авторы:
Abdelmoula El Yazizi, Samee U. Khan, Yaroslav Koshka
Резюме на русском
## Контекст
Область исследования связана с применением квантовых вычислений для решения задач семплирования с помощью Restricted Boltzmann Machines (RBMs). RBMs широко используются в области машинного обучения для семплирования из заданных вероятностных распределений. Несмотря на их большой потенциал, существуют проблемы с качеством семплирования. Для решения этой проблемы рассматривается использование квантовых вычислений, в частности, технологии D-Wave Quantum Annealing. Однако до сих пор не было доказано, что квантовые технологии могут значительно повысить качество семплирования по сравнению с традиционными методами, такими как Markov Chain Monte Carlo (MCMC).
## Метод
Для сравнения D-Wave Quantum Annealing и MCMC использовалась локально-пониженная (local-valley, LV) оценка качества семплирования. Эта методика основывается на сравнении числа локальных минимумов (вырожденных энергетических состояний), которые содержат отдельные выборки, и на вычислении энергии соответствующих минимумов. Эксперименты проводились на последнем поколении квантового аннелинга D-Wave. Для семплирования использовались выборки Gibbsа, полученные при классическом обучении RBM, и выборки, полученные с помощью D-Wave. Отличительной чертой этого подхода является то, что LV-оценка позволяет оценивать качество семплирования не только через локальные минимумы, но и с учетом характеристик энергетических состояний.
## Результаты
Исследования показали, что использование D-Wave Quantum Annealing не приводит к значительному повышению числа локальных минимумов, к которым относится выборка. Хотя D-Wave при семплировании в целом принадлежат большему числу локальных минимумов, многие из этих минимумов не найдены при использовании Gibbs-семплирования. Однако, в сильно высшем пробеле, D-Wave и MCMC находят много общих минимумов, что указывает на некоторую недополняемость двух методов. Более того, удается найти "важные" локальные минимумы, только одним из двух методов, в то время как другой пропускает их. Эти результаты показывают, что D-Wave может давать некий пользу, но не значительно превосходит MCMC, особенно во второй половине этапов обучения RBM, когда качество семплирования может играть ключевую роль для обучения.
## Значимость
Результаты имеют значимую теоретическую и практическую значимость. Они помогают понять, почему квантовые технологии D-Wave не приводят к существенному улучшению качества семплирования, но также открывают пути для повышения качества, в частности, с помощью использования комбинированного классического-квантового подхода. Эти результаты могут быть полезны для развития новых методов семплирования и их использования в области машинного обучения и виртуальных экспери
Abstract
A local-valley (LV) centered approach to assessing the quality of sampling
from Restricted Boltzmann Machines (RBMs) was applied to the latest generation
of the D-Wave quantum annealer. D-Wave and Gibbs samples from a classically
trained RBM were obtained at conditions relevant to the
contrastive-divergence-based RBM learning. The samples were compared for the
number of the LVs to which they belonged and the energy of the corresponding
local minima. No significant (desirable) increase in the number of the LVs has
been achieved by decreasing the D-Wave annealing time. At any training epoch,
the states sampled by the D-Wave belonged to a somewhat higher number of LVs
than in the Gibbs sampling. However, many of those LVs found by the two
techniques differed. For high-probability sampled states, the two techniques
were (unfavorably) less complementary and more overlapping. Nevertheless, many
potentially "important" local minima, i.e., those having intermediate, even if
not high, probability values, were found by only one of the two sampling
techniques while missed by the other. The two techniques overlapped less at
later than earlier training epochs, which is precisely the stage of the
training when modest improvements to the sampling quality could make meaningful
differences for the RBM trainability. The results of this work may explain the
failure of previous investigations to achieve substantial (or any) improvement
when using D-Wave-based sampling. However, the results reveal some potential
for improvement, e.g., using a combined classical-quantum approach.