Anchored Langevin Algorithms

2509.19455v1 stat.ML, cs.LG, math.PR 2025-09-26

Авторы:

Mert Gurbuzbalaban, Hoang M. Nguyen, Xicheng Zhang, Lingjiong Zhu

Резюме на русском

## Контекст Одним из основных задач в машинном обучении является эффективное семплирование из распределений, представляющих собой модели для обработки данных. Одним из популярных подходов является использование методов типа Langevin dynamics, которые позволяют эффективно решать задачи семплирования в высоком размерности. Однако, существуют ограничения. Они не могут семплировать данные, имеющие недифференцируемые компоненты в лог-плотности, что исключает многие прикладные задачи. Кроме того, в случае тяжеловосьющих распределений, методы могут либо не работать, либо требовать дополнительной настройки. Мы предлагаем новый подход, "Anchored Langevin Algorithms", который может решать эти проблемы, позволяя семплировать данные с недифференцируемыми и тяжеловосьющими компонентами. ## Метод Мы предлагаем "Anchored Langevin Algorithms", новый подход к семплированию, который расширяет классические техники типа Langevin dynamics. Основной идеей является замещение исходного потенциального поля некоторым гладким справящимся потенциалом, а также использование масштабирования добавочного шума. Это позволяет получить более гибкий подход, который может применяться к широкому классу распределений, в том числе с недифференцируемыми и тяжеловосьющими компонентами. Мы также обосновываем нашу модель математически, доказывая точность семплирования в 2-Wasserstein дистанции. ## Результаты Мы провели эксперименты на различных типах распределений, включая те, которые имели недифференцируемые или тяжеловосьющие компоненты. Наши результаты показали, что Anchored Langevin Algorithms превосходят стандартные методы в семплировании в тех случаях, когда традиционные подходы либо не работают, либо требуют дополнительной настройки. Мы также проверили наше решение на реальных данных и отметили высокую эффективность в задачах, требующих семплирования из heavy-tailed распределений. ## Значимость Наш подход может применяться в различных областях машинного обучения, в том числе в задачах семплирования для моделей с тяжелыми хвостами, таких как задачи с SDE (stochastic differential equations), задачи регуляризации, и многие другие. Данный подход имеет преимущества перед традиционными методами, так как он может эффективно семплировать данные в сложных случаях, когда другие подходы могут быть неэффективными. Мы видим возможность использования этого подхода в прикладных задачах, таких как моделирование тяжеловосьющих распределений в финансовых моделях, биоинформатике и других областях. ## Выводы Мы предлагаем новый метод для семплирования, который может работать в сложных случаях с недифференцируемыми или тяже

Abstract

Standard first-order Langevin algorithms such as the unadjusted Langevin algorithm (ULA) are obtained by discretizing the Langevin diffusion and are widely used for sampling in machine learning because they scale to high dimensions and large datasets. However, they face two key limitations: (i) they require differentiable log-densities, excluding targets with non-differentiable components; and (ii) they generally fail to sample heavy-tailed targets. We propose anchored Langevin dynamics, a unified approach that accommodates non-differentiable targets and certain classes of heavy-tailed distributions. The method replaces the original potential with a smooth reference potential and modifies the Langevin diffusion via multiplicative scaling. We establish non-asymptotic guarantees in the 2-Wasserstein distance to the target distribution and provide an equivalent formulation derived via a random time change of the Langevin diffusion. We provide numerical experiments to illustrate the theory and practical performance of our proposed approach.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Anchored Langevin Algorithms

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Algorithms and Scientific Software for Quasi-Monte Carlo, Fast Gaussian Process ...

Contraction and entropy production in continuous-time Sinkhorn dynamics

Permutation-Invariant Spectral Learning via Dyson Diffusion

Gaussian Equivalence for Self-Attention: Asymptotic Spectral Analysis of Attenti...

Quantitative convergence of trained single layer neural networks to Gaussian pro...

Навигация