High-Order Langevin Monte Carlo Algorithms

2508.17545v1 stat.ML, cs.LG, math.PR 2025-08-27
Авторы:

Thanh Dang, Mert Gurbuzbalaban, Mohammad Rafiqul Islam, Nian Yao, Lingjiong Zhu

Резюме на русском

## Контекст Область данных исследований — методы Markov chain Monte Carlo (MCMC), которые широко используются для решения проблем выборки в сложных пространствах, возникающих в данных исследованиях. Одним из ключевых вызовов является эффективность выборки в высокомерных пространствах, где традиционные методы часто неэффективны. Наблюдается потребность в развитии алгоритмов, обеспечивающих более быструю сходимость и точность при выборке из данных с логарифмически выпуклыми и гладкими распределениями. ## Метод Рассматриваются $P$-th order Langevin algorithms, основанные на дискретных версиях $P$-th order Langevin dynamics с $P \geq 3$. Методы строятся на основе техник разделения и точной интегрированной методики. Это позволяет достичь гарантий сходимости в метрике Wasserstein. Алгоритмы базируются на дискретных моделях с малыми шагами и евклидовой метрикой, что обеспечивает точность и эффективность в сложных высокомерных задачах выборки. ## Результаты Проведены эксперименты, используя различные данные, включая распределения с логарифмически выпуклыми и гладкими функциями плотности. Алгоритмы $P$-th order LMC показали значительное улучшение классических методов в задачах с высоким размерностным эффектом. Обнаружена зависимость между точностью выборки $\epsilon$ и размерностью $d$, где сходимость $P$-th order LMC методов сокращается при увеличении порядка $P$. Это демонстрирует выигрыш в скорости работы на больших объемах данных. ## Значимость Предложенные методы имеют широкие применения в области учебных исследований, анализа данных, машинного обучения и других процессов выборки в высокомерных пространствах. Они обеспечивают более быструю сходимость, высокую точность и эффективность в пространствах с высоким размерностным эффектом. Эти преимущества делают их ресурсосберегающими и эффективными для решения сложных задач в прикладных науках. ## Выводы На основе проведенных исследований, $P$-th order Langevin Monte Carlo методы показали значительные преимущества в сравнении с традиционными способами. Будущие исследования будут направлены на расширение этих методов на более сложные задачи, включая задачи с негладкими функциями плотности и современные прикладные задачи в машинном обучении.

Abstract

Langevin algorithms are popular Markov chain Monte Carlo (MCMC) methods for large-scale sampling problems that often arise in data science. We propose Monte Carlo algorithms based on the discretizations of $P$-th order Langevin dynamics for any $P\geq 3$. Our design of $P$-th order Langevin Monte Carlo (LMC) algorithms is by combining splitting and accurate integration methods. We obtain Wasserstein convergence guarantees for sampling from distributions with log-concave and smooth densities. Specifically, the mixing time of the $P$-th order LMC algorithm scales as $O\left(d^{\frac{1}{R}}/\epsilon^{\frac{1}{2R}}\right)$ for $R=4\cdot 1_{\{ P=3\}}+ (2P-1)\cdot 1_{\{ P\geq 4\}}$, which has a better dependence on the dimension $d$ and the accuracy level $\epsilon$ as $P$ grows. Numerical experiments illustrate the efficiency of our proposed algorithms.

Ссылки и действия