Investigation of D-Wave quantum annealing for training Restricted Boltzmann Machines and mitigating catastrophic forgetting

2508.15697v1 cs.LG, quant-ph, stat.ML 2025-08-23

Авторы:

Abdelmoula El-Yazizi, Yaroslav Koshka

Резюме на русском

## Контекст Область исследования сосредоточена на исследовании возможностей использования квантовых аннелинг-машин D-Wave для обучения моделей типа Restricted Boltzmann Machines (RBMs). Также внимание уделяется рассмотрению проблемы **catastrophic forgetting (CF)**, которая возникает при многозадачном инкрементном обучении. Мотивацией данного исследования является необходимость решения проблемы несостоятельности квантового аннелинга в D-Wave для улучшения RBM, в сравнении с классическими методами монте-карловых цепей (MCMC). Однако, некоторые моменты в работах, использующих квантовую аппаратуру, показали небольшие, но существующие различия в производительности. Это вдохновило рассмотрение возможности комбинирования классических методов и квантовых методов в создании более эффективных подходов для задач обучения и CF-минимизации. ## Метод Исследование основывается на использовании D-Wave quantum annealer (QA) для генерации значений сигма-распределения, используемых в качестве входных данных для обучения RBM. Методология включает сравнительное исследование QA и MCMC, а на основе полученных результатов разрабатывается гибридный подход, объединяющий мощности обеих методик. Эксперименты проводились на собственных данных, а для оценки качества полученных решений функции ошибок RBM и качества сэмплирования использовались. Также для обучения RBM применялся подход с постепенным добавлением новых классов (incremental learning), чтобы проверить возможность минимизации CF. ## Результаты Детальные эксперименты показали, что в целом, различия в производительности между QA и MCMC незначительны. Однако QA-сэмплинг демонстрирует незначительное преимущество в сэмплировании в средних и низких процентилях распределения. Обучение RBM с помощью QA не дало значимых преимуществ по сравнению с MCMC. Однако, применяя QA в контексте CF-минимизации, можно использовать метод **generative replay**, генерируя новые данные для категорий, которые могут быть забыты в процессе многозадачного обучения. Это позволило показать, что QA может генерировать разнообразные и качественные сэмплы для CF-минимизации, приблизительно на уровне классических методов. ## Значимость Полученные результаты имеют перспективу в нескольких областях: 1) Улучшение обучения RBMs и других моделей, когда применяются квантовые методы для сэмплирования; 2) Минимизация CF при многозадачном обучении, где QA позволяет генерировать разнообразные сэмплы, значительно увеличивая эффективность метода generative replay; 3) Потенциал для дальнейшего улучшения технологий квантового сэмплинга, что может сделать QA более эффективным в будущих исследованиях. ## Выводы В ходе работы было доказано,

Abstract

Modest statistical differences between the sampling performances of the D-Wave quantum annealer (QA) and the classical Markov Chain Monte Carlo (MCMC), when applied to Restricted Boltzmann Machines (RBMs), are explored to explain, and possibly address, the absence of significant and consistent improvements in RBM trainability when the D-Wave sampling was used in previous investigations. A novel hybrid sampling approach, combining the classical and the QA contributions, is investigated as a promising way to benefit from the modest differences between the two sampling methods. No improvements in the RBM training are achieved in this work, thereby suggesting that the differences between the QA-based and MCMC sampling, mainly found in the medium-to-low probability regions of the distribution, which are less important for the quality of the sample, are insufficient to benefit the training. Difficulties in achieving sufficiently high quality of embedding RBMs into the lattice of the newer generation of D-Wave hardware could be further complicating the task. On the other hand, the ability to generate samples of sufficient variety from lower-probability parts of the distribution has a potential to benefit other machine learning applications, such as the mitigation of catastrophic forgetting (CF) during incremental learning. The feasibility of using QA-generated patterns of desirable classes for CF mitigation by the generative replay is demonstrated in this work for the first time. While the efficiency of the CF mitigation using the D-Wave QA was comparable to that of the classical mitigation, both the speed of generating a large number of distinct desirable patterns and the potential for further improvement make this approach promising for a variety of challenging machine learning applications.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Investigation of D-Wave quantum annealing for training Restricted Boltzmann Machines and mitigating catastrophic forgetting

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Unlocking the Power of Boltzmann Machines by Parallelizable Sampler and Efficien...

Comparison of D-Wave Quantum Annealing and Markov Chain Monte Carlo for Sampling...

Comparison of D-Wave Quantum Annealing and Markov Chain Monte Carlo for Sampling...

Навигация