A hierarchical entropy method for the delocalization of bias in high-dimensional Langevin Monte Carlo
2509.08619v1
stat.ML, cs.LG, math.PR
2025-09-12
Авторы:
Daniel Lacker, Fuzhong Zhou
Резюме на русском
## Контекст
В современной математике и статистике широко используется метод Ланжевина для сэмплирования из сложных высокомасштабных распределений. Однако этот метод имеет значительную ошибку в сэмплировании, которая увеличивается пропорционально размерности пространства в квадрате, измеряемой по расстоянию в числе Вассерштейна. Несмотря на это, в последнее время выявлена интересная структурная особенность: если распределение имеет спарсенные взаимосвязи, то ошибка сэмплирования зависит только от размерности самой спарсенной части. В рамках этого исследования мы расширяем это понятие, показывая, что подобная структурная особенность присутствует даже в случае слабых взаимосвязей, а не только в случае спарсенности. Таким образом, мы монтируем новые горизонты в понимании и улучшении качества сэмплирования при помощи теории высокомасштабных распределений.
## Метод
Мы применяем метод Ланжевина в высокоразмерных пространствах с целью оценивать распределение данных. Наша методология основывается на новом подходе к расчету энтропии в разные масштабы. Ранее известный метод деллокализации ошибки был ограничен определенным классом распределений с сильными взаимосвязями. Мы расширяем его доступность, доказывая, что данный эффект действует и для слабых взаимосвязей. Мы используем новый анализ, основанный на рекурсивной работе с маргинальными распределениями, что позволяет доказать новые теоретические свойства метода Ланжевина в задачах сэмплирования спарсенных пространств.
## Результаты
Мы проводим эксперименты на основе синтетических данных, которые подтверждают полученные результаты. Наши результаты показывают, что для распределений с сильными и слабыми взаимосвязями распределение не только имеет меньшую ошибку, но и распределяется более равномерно по размерности. Мы тестируем нашу новую методологию на разных классах распределений и показываем, что наш подход дает значительное улучшение по сравнению с ранее известными методами в задачах сэмплирования спарсенных пространств.
## Значимость
Наша работа имеет практическое значение в области сэмплирования сложных высокомасштабных распределений, которые часто встречаются в машинном обучении и финансовых моделях. Новый подход позволяет улучшить точность и эффективность сэмплирования в случаях спарсенных распределений. Это открывает новые возможности для применения метода Ланжевина в сложных задачах, где ранее он был неэффективен из-за высокой размерности. Также наши результаты могут быть использованы в разработке новых методов сэмплирования для задач с малои
Abstract
The unadjusted Langevin algorithm is widely used for sampling from complex
high-dimensional distributions. It is well known to be biased, with the bias
typically scaling linearly with the dimension when measured in squared
Wasserstein distance. However, the recent paper of Chen et al. (2024)
identifies an intriguing new delocalization effect: For a class of
distributions with sparse interactions, the bias between low-dimensional
marginals scales only with the lower dimension, not the full dimension. In this
work, we strengthen the results of Chen et al. (2024) in the sparse interaction
regime by removing a logarithmic factor, measuring distance in relative entropy
(a.k.a. KL-divergence), and relaxing the strong log-concavity assumption. In
addition, we expand the scope of the delocalization phenomenon by showing that
it holds for a class of distributions with weak interactions. Our proofs are
based on a hierarchical analysis of the marginal relative entropies, inspired
by the authors' recent work on propagation of chaos.