Comparison of D-Wave Quantum Annealing and Markov Chain Monte Carlo for Sampling from a Probability Distribution of a Restricted Boltzmann Machine

2508.10228v1 cs.LG, quant-ph, stat.ML 2025-08-16

Авторы:

Abdelmoula El Yazizi, Samee U. Khan, Yaroslav Koshka

Резюме на русском

## Контекст Сети Больцмана — дискретные статистические модели, применяемые в машинном обучении, визуальном распознавании и анализе текста. Одна из наиболее известных моделей — ограниченная сеть Больцмана (Restricted Boltzmann Machine, RBM), которая обладает фундаментальным значением в задачах семантического понимания и распознавания образов. Однако существуют проблемы со сходимостью и эффективностью обучения таких сетей. Эффективность обучения RBM может быть значительно улучшена с помощью семплирования из вероятностной модели, но эта задача требует сложных методов семплирования. Одним из таких методов является метод Монте-Карло по стохастическому аннеалингу (Quantum Annealing), который может обеспечить более точное семплирование по сравнению с традиционными методами. В этом исследовании был проведен сравнительный анализ методов семплирования для RBM. ## Метод Для сравнения использовались два метода: **семплирование через D-Wave (Quantum Annealing)** и **метод Монте-Карло по Марковским цепям (Markov Chain Monte Carlo, MCMC)**. Основной идеей Quantum Annealing является поиск локальных минимумов возможных состояний сети Больцмана с помощью квантовых процессов. Метод MCMC, в свою очередь, семплирует состояния с помощью стохастических процессов. Оба метода были применены к тренировочным данным RBM с разными параметрами, включая контрастное разделение и эпохи тренировки. Для сравнения использовались показатели, такие как доля локальных минимумов, к которым принадлежат семплируемые состояния. ## Результаты На основе проведенных экспериментов выяснилось, что **D-Wave** может обеспечить более разнообразное семплирование по сравнению с MCMC. Однако, несмотря на то, что D-Wave обнаруживает больше локальных минимумов, многие из них отличаются от тех, которые обнаруживает MCMC. Это может быть связано с разными механизмами поиска минимумов в двух методах. Также было выявлено, что **D-Wave** обнаруживает больше локальных минимумов в более поздних эпохах обучения, что может быть связано с увеличением степени сложности в RBM. Однако, в целом, не было доказано значительное улучшение числа локальных минимумов при использовании D-Wave в сравнении с MCMC. ## Значимость Результаты имеют большое значение для области машинного обучения и семплирования в моделях Больцмана. Использование квантовых методов, таких как D-Wave, может помочь улучшить качество семплирования в RBM, что может быть решающим для задач, требующих высокой точности. Будущие исследования могут сфокусироваться на создании комбинированных классическо-квантовых подходов, которые могут объединить преимущества метода

Abstract

A local-valley (LV) centered approach to assessing the quality of sampling from Restricted Boltzmann Machines (RBMs) was applied to the latest generation of the D-Wave quantum annealer. D-Wave and Gibbs samples from a classically trained RBM were obtained at conditions relevant to the contrastive-divergence-based RBM learning. The samples were compared for the number of the LVs to which they belonged and the energy of the corresponding local minima. No significant (desirable) increase in the number of the LVs has been achieved by decreasing the D-Wave annealing time. At any training epoch, the states sampled by the D-Wave belonged to a somewhat higher number of LVs than in the Gibbs sampling. However, many of those LVs found by the two techniques differed. For high-probability sampled states, the two techniques were (unfavorably) less complementary and more overlapping. Nevertheless, many potentially "important" local minima, i.e., those having intermediate, even if not high, probability values, were found by only one of the two sampling techniques while missed by the other. The two techniques overlapped less at later than earlier training epochs, which is precisely the stage of the training when modest improvements to the sampling quality could make meaningful differences for the RBM trainability. The results of this work may explain the failure of previous investigations to achieve substantial (or any) improvement when using D-Wave-based sampling. However, the results reveal some potential for improvement, e.g., using a combined classical-quantum approach.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Comparison of D-Wave Quantum Annealing and Markov Chain Monte Carlo for Sampling from a Probability Distribution of a Restricted Boltzmann Machine

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Unlocking the Power of Boltzmann Machines by Parallelizable Sampler and Efficien...

Investigation of D-Wave quantum annealing for training Restricted Boltzmann Mach...

Comparison of D-Wave Quantum Annealing and Markov Chain Monte Carlo for Sampling...

Навигация