Comparison of D-Wave Quantum Annealing and Markov Chain Monte Carlo for Sampling from a Probability Distribution of a Restricted Boltzmann Machine

2508.10228v2 cs.LG, quant-ph, stat.ML 2025-08-18
Авторы:

Abdelmoula El Yazizi, Samee U. Khan, Yaroslav Koshka

Резюме на русском

## Контекст Область исследования связана с применением квантовых вычислений для решения задач семплирования с помощью Restricted Boltzmann Machines (RBMs). RBMs широко используются в области машинного обучения для семплирования из заданных вероятностных распределений. Несмотря на их большой потенциал, существуют проблемы с качеством семплирования. Для решения этой проблемы рассматривается использование квантовых вычислений, в частности, технологии D-Wave Quantum Annealing. Однако до сих пор не было доказано, что квантовые технологии могут значительно повысить качество семплирования по сравнению с традиционными методами, такими как Markov Chain Monte Carlo (MCMC). ## Метод Для сравнения D-Wave Quantum Annealing и MCMC использовалась локально-пониженная (local-valley, LV) оценка качества семплирования. Эта методика основывается на сравнении числа локальных минимумов (вырожденных энергетических состояний), которые содержат отдельные выборки, и на вычислении энергии соответствующих минимумов. Эксперименты проводились на последнем поколении квантового аннелинга D-Wave. Для семплирования использовались выборки Gibbsа, полученные при классическом обучении RBM, и выборки, полученные с помощью D-Wave. Отличительной чертой этого подхода является то, что LV-оценка позволяет оценивать качество семплирования не только через локальные минимумы, но и с учетом характеристик энергетических состояний. ## Результаты Исследования показали, что использование D-Wave Quantum Annealing не приводит к значительному повышению числа локальных минимумов, к которым относится выборка. Хотя D-Wave при семплировании в целом принадлежат большему числу локальных минимумов, многие из этих минимумов не найдены при использовании Gibbs-семплирования. Однако, в сильно высшем пробеле, D-Wave и MCMC находят много общих минимумов, что указывает на некоторую недополняемость двух методов. Более того, удается найти "важные" локальные минимумы, только одним из двух методов, в то время как другой пропускает их. Эти результаты показывают, что D-Wave может давать некий пользу, но не значительно превосходит MCMC, особенно во второй половине этапов обучения RBM, когда качество семплирования может играть ключевую роль для обучения. ## Значимость Результаты имеют значимую теоретическую и практическую значимость. Они помогают понять, почему квантовые технологии D-Wave не приводят к существенному улучшению качества семплирования, но также открывают пути для повышения качества, в частности, с помощью использования комбинированного классического-квантового подхода. Эти результаты могут быть полезны для развития новых методов семплирования и их использования в области машинного обучения и виртуальных экспери

Abstract

A local-valley (LV) centered approach to assessing the quality of sampling from Restricted Boltzmann Machines (RBMs) was applied to the latest generation of the D-Wave quantum annealer. D-Wave and Gibbs samples from a classically trained RBM were obtained at conditions relevant to the contrastive-divergence-based RBM learning. The samples were compared for the number of the LVs to which they belonged and the energy of the corresponding local minima. No significant (desirable) increase in the number of the LVs has been achieved by decreasing the D-Wave annealing time. At any training epoch, the states sampled by the D-Wave belonged to a somewhat higher number of LVs than in the Gibbs sampling. However, many of those LVs found by the two techniques differed. For high-probability sampled states, the two techniques were (unfavorably) less complementary and more overlapping. Nevertheless, many potentially "important" local minima, i.e., those having intermediate, even if not high, probability values, were found by only one of the two sampling techniques while missed by the other. The two techniques overlapped less at later than earlier training epochs, which is precisely the stage of the training when modest improvements to the sampling quality could make meaningful differences for the RBM trainability. The results of this work may explain the failure of previous investigations to achieve substantial (or any) improvement when using D-Wave-based sampling. However, the results reveal some potential for improvement, e.g., using a combined classical-quantum approach.

Ссылки и действия

Связанные статьи

Investigation of D-Wave quantum annealing for training Restricted Boltzmann Mach...

## Контекст Область исследования сосредоточена на исследовании возможностей использования квантовых аннелинг-машин D-Wa...

2025-08-23

Comparison of D-Wave Quantum Annealing and Markov Chain Monte Carlo for Sampling...

## Контекст Сети Больцмана — дискретные статистические модели, применяемые в машинном обучении, визуальном распознавани...

2025-08-16