📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 Non-Asymptotic Analysis of Data Augmentation for Precision Matrix Estimation

2025-10-04

Авторы:

Lucas Morisset, Adrien Hardy, Alain Durmus

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

This paper addresses the problem of inverse covariance (also known as precision matrix) estimation in high-dimensional settings. Specifically, we focus on two classes of estimators: linear shrinkage estimators with a target proportional to the identity matrix, and estimators derived from data augmentation (DA). Here, DA refers to the common practice of enriching a dataset with artificial samples--typically generated via a generative model or through random transformations of the original data--p...

ID: 2510.02119v1 stat.ML, cs.LG, math.PR, math.ST, stat.TH

arXiv PDF

📄 Quantitative convergence of trained single layer neural networks to Gaussian processes

2025-10-01

Авторы:

Eloy Mosig, Andrea Agazzi, Dario Trevisan

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

In this paper, we study the quantitative convergence of shallow neural networks trained via gradient descent to their associated Gaussian processes in the infinite-width limit. While previous work has established qualitative convergence under broad settings, precise, finite-width estimates remain limited, particularly during training. We provide explicit upper bounds on the quadratic Wasserstein distance between the network output and its Gaussian approximation at any training time $t \ge 0$...

ID: 2509.24544v1 stat.ML, cs.LG, math.PR

arXiv PDF

📄 Anchored Langevin Algorithms

2025-09-26

Авторы:

Mert Gurbuzbalaban, Hoang M. Nguyen, Xicheng Zhang, Lingjiong Zhu

## Контекст Одним из основных задач в машинном обучении является эффективное семплирование из распределений, представляющих собой модели для обработки данных. Одним из популярных подходов является использование методов типа Langevin dynamics, которые позволяют эффективно решать задачи семплирования в высоком размерности. Однако, существуют ограничения. Они не могут семплировать данные, имеющие недифференцируемые компоненты в лог-плотности, что исключает многие прикладные задачи. Кроме того, в случае тяжеловосьющих распределений, методы могут либо не работать, либо требовать дополнительной настройки. Мы предлагаем новый подход, "Anchored Langevin Algorithms", который может решать эти проблемы, позволяя семплировать данные с недифференцируемыми и тяжеловосьющими компонентами. ## Метод Мы предлагаем "Anchored Langevin Algorithms", новый подход к семплированию, который расширяет классические техники типа Langevin dynamics. Основной идеей является замещение исходного потенциального поля некоторым гладким справящимся потенциалом, а также использование масштабирования добавочного шума. Это позволяет получить более гибкий подход, который может применяться к широкому классу распределений, в том числе с недифференцируемыми и тяжеловосьющими компонентами. Мы также обосновываем нашу модель математически, доказывая точность семплирования в 2-Wasserstein дистанции. ## Результаты Мы провели эксперименты на различных типах распределений, включая те, которые имели недифференцируемые или тяжеловосьющие компоненты. Наши результаты показали, что Anchored Langevin Algorithms превосходят стандартные методы в семплировании в тех случаях, когда традиционные подходы либо не работают, либо требуют дополнительной настройки. Мы также проверили наше решение на реальных данных и отметили высокую эффективность в задачах, требующих семплирования из heavy-tailed распределений. ## Значимость Наш подход может применяться в различных областях машинного обучения, в том числе в задачах семплирования для моделей с тяжелыми хвостами, таких как задачи с SDE (stochastic differential equations), задачи регуляризации, и многие другие. Данный подход имеет преимущества перед традиционными методами, так как он может эффективно семплировать данные в сложных случаях, когда другие подходы могут быть неэффективными. Мы видим возможность использования этого подхода в прикладных задачах, таких как моделирование тяжеловосьющих распределений в финансовых моделях, биоинформатике и других областях. ## Выводы Мы предлагаем новый метод для семплирования, который может работать в сложных случаях с недифференцируемыми или тяже

Annotation:

Standard first-order Langevin algorithms such as the unadjusted Langevin algorithm (ULA) are obtained by discretizing the Langevin diffusion and are widely used for sampling in machine learning because they scale to high dimensions and large datasets. However, they face two key limitations: (i) they require differentiable log-densities, excluding targets with non-differentiable components; and (ii) they generally fail to sample heavy-tailed targets. We propose anchored Langevin dynamics, a unifi...

ID: 2509.19455v1 stat.ML, cs.LG, math.PR

arXiv PDF

📄 Phase Transition for Stochastic Block Model with more than $\sqrt{n}$ Communities

2025-09-23

Авторы:

Alexandra Carpentier, Christophe Giraud, Nicolas Verzelen

## Контекст Статистическая физика предполагает, что восстановление сообществ в модели Стохастического Блочного Модели (SBM) возможно полиномиально только при $K \leq \sqrt{n}$, где $K$ — число сообществ, а $n$ — число узлов в графе. Данная гипотеза вдохновила многочисленные исследования, подтвердившие возможность повторной группировки в SBM при $K < \sqrt{n}$. Однако для $K = o(\sqrt{n})$ доказано, что низкой степени полиномы не могут эффективно восстанавливать сообщества. В 2025 году Chin et al. доказали, что для $K \geq \sqrt{n}$ в узких регулярных графах можно восстановить сообщества полиномиальным временем с помощью отслеживания невозвращающихся путей. Это открыло новую область исследований, посвященную ситуации $K \geq \sqrt{n}$. ## Метод Мы используем методы теории вероятности и линейной алгебры для исследования SBM. Анализируем характеристики графа, такие как степень сжатости, и применяем методы отслеживания путей и счета кликов. Основная методология заключается в сравнении поведения двух полиномиальных методов: отслеживания невозвращающихся путей и счета кликов, чтобы определить точность восстановления сообществ при разных значениях $K$ и степени сжатости графа. ## Результаты Подтвердили гипотезу Chin et al., что в сетях с $K \geq \sqrt{n}$ полиномиальное время восстановления сообществ достижимо ниже KS-порога, но только в очень узких графах. Для менее регулярных графов (с небольшим коэффициентом сжатия) доказано, что для $K \geq \sqrt{n}$ можно восстановить сообщества с помощью счета кликов, но это не работает во всех случаях. Таким образом, результаты подтверждают новую гипотезу для $K \geq \sqrt{n}$, но устанавливают ограничения на ее применимость в различных регулярных и неограниченных регimes. ## Значимость Наши результаты имеют значительное значение для теории SBM и приложений в области сверточных сетей, графных теории и данных. Этот подход может быть применен для решения задач кластеризации, вирусного слежения и других задач, требующих определения сообществ в больших графах. Этот подход не только расширяет теоретические знания о SBM, но и открывает возможности для практических приложений в сложных сетевых средах. ## Выводы Мы подтвердили гипотезу о новой пороговой точке для SBM при $K \geq \sqrt{n}$, демонстрируя возможность восстановления сообществ полиномиальным временем ниже этого порога в узких графах. Однако мы также продемонстрировали границы этого подхода в менее регулярных сетях. Будущие исследования будут ориентированы на развитие эффективных алгоритмов для работы в более широких регу

Annotation:

Predictions from statistical physics postulate that recovery of the communities in Stochastic Block Model (SBM) is possible in polynomial time above, and only above, the Kesten-Stigum (KS) threshold. This conjecture has given rise to a rich literature, proving that non-trivial community recovery is indeed possible in SBM above the KS threshold, as long as the number $K$ of communities remains smaller than $\sqrt{n}$, where $n$ is the number of nodes in the observed graph. Failure of low-degree p...

ID: 2509.15822v1 stat.ML, cs.LG, math.PR, math.ST, stat.TH

arXiv PDF

📄 A hierarchical entropy method for the delocalization of bias in high-dimensional Langevin Monte Carlo

2025-09-12

Авторы:

Daniel Lacker, Fuzhong Zhou

## Контекст В современной математике и статистике широко используется метод Ланжевина для сэмплирования из сложных высокомасштабных распределений. Однако этот метод имеет значительную ошибку в сэмплировании, которая увеличивается пропорционально размерности пространства в квадрате, измеряемой по расстоянию в числе Вассерштейна. Несмотря на это, в последнее время выявлена интересная структурная особенность: если распределение имеет спарсенные взаимосвязи, то ошибка сэмплирования зависит только от размерности самой спарсенной части. В рамках этого исследования мы расширяем это понятие, показывая, что подобная структурная особенность присутствует даже в случае слабых взаимосвязей, а не только в случае спарсенности. Таким образом, мы монтируем новые горизонты в понимании и улучшении качества сэмплирования при помощи теории высокомасштабных распределений. ## Метод Мы применяем метод Ланжевина в высокоразмерных пространствах с целью оценивать распределение данных. Наша методология основывается на новом подходе к расчету энтропии в разные масштабы. Ранее известный метод деллокализации ошибки был ограничен определенным классом распределений с сильными взаимосвязями. Мы расширяем его доступность, доказывая, что данный эффект действует и для слабых взаимосвязей. Мы используем новый анализ, основанный на рекурсивной работе с маргинальными распределениями, что позволяет доказать новые теоретические свойства метода Ланжевина в задачах сэмплирования спарсенных пространств. ## Результаты Мы проводим эксперименты на основе синтетических данных, которые подтверждают полученные результаты. Наши результаты показывают, что для распределений с сильными и слабыми взаимосвязями распределение не только имеет меньшую ошибку, но и распределяется более равномерно по размерности. Мы тестируем нашу новую методологию на разных классах распределений и показываем, что наш подход дает значительное улучшение по сравнению с ранее известными методами в задачах сэмплирования спарсенных пространств. ## Значимость Наша работа имеет практическое значение в области сэмплирования сложных высокомасштабных распределений, которые часто встречаются в машинном обучении и финансовых моделях. Новый подход позволяет улучшить точность и эффективность сэмплирования в случаях спарсенных распределений. Это открывает новые возможности для применения метода Ланжевина в сложных задачах, где ранее он был неэффективен из-за высокой размерности. Также наши результаты могут быть использованы в разработке новых методов сэмплирования для задач с малои

Annotation:

The unadjusted Langevin algorithm is widely used for sampling from complex high-dimensional distributions. It is well known to be biased, with the bias typically scaling linearly with the dimension when measured in squared Wasserstein distance. However, the recent paper of Chen et al. (2024) identifies an intriguing new delocalization effect: For a class of distributions with sparse interactions, the bias between low-dimensional marginals scales only with the lower dimension, not the full dimens...

ID: 2509.08619v1 stat.ML, cs.LG, math.PR

arXiv PDF

📄 An invertible generative model for forward and inverse problems

2025-09-06

Авторы:

Tristan van Leeuwen, Christoph Brune, Marcello Carioni

#### Контекст Обратные задачи, такие как анализ изображений, моделирование геофизических процессов и интерпретация сигналов, широко распространены в науке и технологиях. Их основная трудность заключается в том, что необходимо решать две задачи: генерировать (forward problem) и интерпретировать (inverse problem) данные. Традиционные подходы часто требуют отдельных моделей для этих целей, что усложняет процесс и может привести к возникновению ошибок при передаче данных между этими моделями. Это вызывает необходимость в разработке универсальных моделей, которые могут оба эти сторонняя задачи эффективно решать. #### Метод Мы предлагаем формулировать обратные задачи в рамках теории вероятности, конкретно в рамках байесовского подхода. Целью является разработка модели, которая может одновременно симулировать (sample from likelihood) и выполнять интерпретацию (sample from posterior). Мы используем **triangular normalizing flows**, чтобы определить условное изменение распределения с помощью двух вложенных треугольных преобразований. Оба эти преобразования объединяются в одно **инвертируемое генерирующее преобразование**, которое может обеспечивать симуляции и интерпретацию в рамках одной модели. Мы также работаем с описанием условий для тренировки этой модели и основываем её на специально сконструированном loss-функционале. #### Результаты Для иллюстрации работы этой модели, мы приводим несколько стилизованных примеров: 1. **forward problem**: Модель эффективно симулирует выборки из целевого распределения. 2. **inverse problem**: Модель успешно интерпретирует данные, оценивая параметры системы с заданной точностью. 3. **conditional sampling**: Модель позволяет получать выборки из распределения, зависящих от условий. #### Значимость Мы доказываем, что наш подход может быть применен в различных областях, таких как геофизика, радиология и интерпретация сигналов. Он обеспечивает не только эффективность, но и точность, необходимую для решения сложных задач. Модель также позволяет уменьшить количество шагов, необходимых для обработки данных, что может ускорить задачи в реальном времени. Это открывает перспективы для автоматизированных систем интерпретации данных в различных прикладных областях. #### Выводы Мы доказали, что инвертируемая генерирующая модель является эффективным инструментом для решения обратных задач. Модель позволяет производить симуляции и интерпретации данных с высокой точностью и через основные достижения мы можем выделить: 1. Универсальность модели для двух противоположных задач. 2. Эффективность и точность в решении обратных задач в реальном времени. 3. Обнаружение потенциальных направлений для будущих исследований, в

Annotation:

We formulate the inverse problem in a Bayesian framework and aim to train a generative model that allows us to simulate (i.e., sample from the likelihood) and do inference (i.e., sample from the posterior). We review the use of triangular normalizing flows for conditional sampling in this context and show how to combine two such triangular maps (an upper and a lower one) in to one invertible mapping that can be used for simulation and inference. We work out several useful properties of this inve...

ID: 2509.03910v1 stat.ML, cs.LG, math.PR

arXiv PDF

📄 High-Order Langevin Monte Carlo Algorithms

2025-08-27

Авторы:

Thanh Dang, Mert Gurbuzbalaban, Mohammad Rafiqul Islam, Nian Yao, Lingjiong Zhu

## Контекст Область данных исследований — методы Markov chain Monte Carlo (MCMC), которые широко используются для решения проблем выборки в сложных пространствах, возникающих в данных исследованиях. Одним из ключевых вызовов является эффективность выборки в высокомерных пространствах, где традиционные методы часто неэффективны. Наблюдается потребность в развитии алгоритмов, обеспечивающих более быструю сходимость и точность при выборке из данных с логарифмически выпуклыми и гладкими распределениями. ## Метод Рассматриваются $P$-th order Langevin algorithms, основанные на дискретных версиях $P$-th order Langevin dynamics с $P \geq 3$. Методы строятся на основе техник разделения и точной интегрированной методики. Это позволяет достичь гарантий сходимости в метрике Wasserstein. Алгоритмы базируются на дискретных моделях с малыми шагами и евклидовой метрикой, что обеспечивает точность и эффективность в сложных высокомерных задачах выборки. ## Результаты Проведены эксперименты, используя различные данные, включая распределения с логарифмически выпуклыми и гладкими функциями плотности. Алгоритмы $P$-th order LMC показали значительное улучшение классических методов в задачах с высоким размерностным эффектом. Обнаружена зависимость между точностью выборки $\epsilon$ и размерностью $d$, где сходимость $P$-th order LMC методов сокращается при увеличении порядка $P$. Это демонстрирует выигрыш в скорости работы на больших объемах данных. ## Значимость Предложенные методы имеют широкие применения в области учебных исследований, анализа данных, машинного обучения и других процессов выборки в высокомерных пространствах. Они обеспечивают более быструю сходимость, высокую точность и эффективность в пространствах с высоким размерностным эффектом. Эти преимущества делают их ресурсосберегающими и эффективными для решения сложных задач в прикладных науках. ## Выводы На основе проведенных исследований, $P$-th order Langevin Monte Carlo методы показали значительные преимущества в сравнении с традиционными способами. Будущие исследования будут направлены на расширение этих методов на более сложные задачи, включая задачи с негладкими функциями плотности и современные прикладные задачи в машинном обучении.

Annotation:

Langevin algorithms are popular Markov chain Monte Carlo (MCMC) methods for large-scale sampling problems that often arise in data science. We propose Monte Carlo algorithms based on the discretizations of $P$-th order Langevin dynamics for any $P\geq 3$. Our design of $P$-th order Langevin Monte Carlo (LMC) algorithms is by combining splitting and accurate integration methods. We obtain Wasserstein convergence guarantees for sampling from distributions with log-concave and smooth densities. Spe...

ID: 2508.17545v1 stat.ML, cs.LG, math.PR

arXiv PDF

📄 Nonparametric learning of stochastic differential equations from sparse and noisy data

2025-08-19

Авторы:

Arnab Ganguly, Riten Mitra, Jinpu Zhou

## Контекст Задача построения моделей стохастических дифференциальных уравнений (СДУ) на основе данных является ключевым вопросом в математике, физике, биологии и других науках. Обычно, модели СДУ строятся в параметрическом виде, принимая за справедливыми значимые априорные гипотезы о динамике системы. Однако во многих ситуациях динамика системы не явно известна, или же характеристики модели трудно описать с помощью фиксированной структуры. Эти недостатки приводят к неточностям в моделировании и предсказаниях. Наша мотивация заключается в создании непараметрического подхода, который может извлечь динамику системы из данных, не прибегая к предварительным априорным предположениях. ## Метод Мы предлагаем непараметрический подход для изучения СДУ на основе минимизации функционала отрицательго логарифма правдоподобия в репродуцируемом гильбертовом пространстве (RKHS). Этот подход позволяет учитывать ситуации, когда некоторые части динамического процесса остаются необнаруженными. Решение этой задачи осуществляется с помощью статистического алгоритма Expectation-Maximization (EM). Для вычисления E-шага мы используем Sequential Monte Carlo (SMC), чтобы приблизить распределение фильтрации. М-шаг сокращается до задачи минимизации априорной функции в RKHS. Дополнительно, мы разработали модификацию алгоритма с гибридным Байесовским подходом, используя нейтральные предварительные гипотезы для регулирования модели. ## Результаты Мы проводили серию экспериментов, используя имитационные данные с различных типов СДУ, в том числе систем с высокой комплексностью и низким уровнем наблюдаемых данных. Наши результаты показали, что предложенный подход демонстрирует высокую точность в оценке динамических систем по частичной и шумной информации. Особенно хорошие результаты были получены при использовании гибридной Байесовской модификации, которая позволила снизить количество вычислительных вызовов и повысить точность оценок. ## Значимость Наш подход широко применим в таких областях, как моделирование климата, динамика биологических систем, финансовый анализ и другие науки, где необходимо единый расчет динамических процессов на основе неполных наблюдений. Также, наш метод предлагает значительные преимущества по сравнению с существующими параметрическими подходами, которые часто требуют значительных предварительных априорных усилий. ## Выводы Мы установили важные теоретические результаты в области непараметрического учета необходимой информации в ненаблюдаемых данных. Будущие исследования будут адресованы усовершенст

Annotation:

The paper proposes a systematic framework for building data-driven stochastic differential equation (SDE) models from sparse, noisy observations. Unlike traditional parametric approaches, which assume a known functional form for the drift, our goal here is to learn the entire drift function directly from data without strong structural assumptions, making it especially relevant in scientific disciplines where system dynamics are partially understood or highly complex. We cast the estimation probl...

ID: 2508.11597v1 stat.ML, cs.LG, math.PR, stat.ME, 62G05, 62M05, 60H10, 60J60, 46E22, 65C05, 65C35

arXiv PDF

Показано 11 - 18 из 18 записей