📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
Авторы:
Marat Khusainov, Marina Sheshukova, Alain Durmus, Sergey Samsonov
## Контекст
Область исследований в данной работе относится к линейной регрессии, одной из ключевых задач машинного обучения и статистики. Одной из основных проблем в этой области является точность и скорость построения аппроксимации гауссовского распределения при онлайн-обучении. Задачу становится все более актуальной в условиях больших данных и необходимости ускорения вычислений. Существующие методы часто не могут обеспечить достаточную точность с учетом размера выборки и количества параметров. Мотивация для данного исследования заключается в развитии более эффективных методов для построения гауссовской аппроксимации в ситуациях, где объем данных и количество итераций являются ограниченными.
## Метод
В статье предлагается метод онлайн-обучения с использованием линейных моделей и гауссовской аппроксимации. Основная идея заключается в использовании стохастического градиентного спуска с константным обновлением и адаптивной оценке дисперсии. Архитектура метода основана на теории градиентных методов и теории оцениваемости. Для построения аппроксимации используется теория SGD (Stochastic Gradient Descent) и подходы к оцениванию градиентов. Это позволяет поддерживать стабильность и эффективность аппроксимации даже при больших размерах выборки.
## Результаты
В результате экспериментов показано, что скорость нормальной аппроксимации является около $\sqrt{\log{n}/n}$ при достаточно больших значениях $n$. Эксперименты проводились на синтетических данных с различным размером выборки и количеством параметров. Полученные данные подтверждают теоретические результаты и показывают, что метод эффективен даже при высокой размерности пространства признаков $d$. Также проводилась сравнительная оценка с другими подходами, показав выигрыш в скорости и точности.
## Значимость
Результаты имеют большое значение для применения в онлайн-линейных регрессионных задачах, где требуется высокая скорость и точность аппроксимации. Метод может быть применен в ситуациях, когда необходимо решать задачи в реальном времени с большим количеством данных. Это может иметь практическое применение в сферах, таких как финансы, искусственный интеллект, биоинформатика и другие. Благодаря высокой эффективности и гибкости, данный подход может стать основой для развития новых методов в области машинного обучения.
## Выводы
В данной работе были получены новые результаты по теории гауссовской аппроксимации в онлайн-линейных регрессионных задачах. Было установлено, что при достаточно больших объемах данных можно достичь скорости нормальной апп
Annotation:
In this paper, we consider the problem of Gaussian approximation for the
online linear regression task. We derive the corresponding rates for the
setting of a constant learning rate and study the explicit dependence of the
convergence rate upon the problem dimension $d$ and quantities related to the
design matrix. When the number of iterations $n$ is known in advance, our
results yield the rate of normal approximation of order $\sqrt{\log{n}/n}$,
provided that the sample size $n$ is large enough...
Авторы:
Hong Ye Tan, Stanley Osher, Wuchen Li
## Контекст
Семплирование из Гиббсовых законов распределения широко применяется в различных областях, включая машинное обучение, графику и физические модели. Однако существуют значительные проблемы с эффективностью и точностью таких процессов, особенно при работе с нелинейными и негладкими потенциалами. Это приводит к необходимости развития новых методов, которые могли бы улучшить стабильность и точность семплирования. Наша мотивация заключается в исследовании новых алгоритмов, которые могли бы решить эти проблемы, в том числе предлагая новые аппроксимации и математические решения для улучшения семплирования.
## Метод
Мы предлагаем подсистему, основанную на preconditioned regularized Wasserstein proximal sampling. Основная идея заключается в использовании оптимизационного подхода, где мы используем нормализованный закон распределения, регулируемый регуляризатором. Это достигается при помощи Cole--Hopf-трансформации, которая позволяет связать кратковременные решения с градиентным потоком. Мы также предлагаем алгоритм, который использует аппроксимацию score function, полученной через регуляризацию градиента. Такой подход позволяет улучшить стабильность и точность семплирования, особенно в случае независимого от шага скорости сходимости.
## Результаты
Мы проводили эксперименты, используя различные лог-конкавые и не-лог-конкавые распределения, включая постановку задачи баYESianьных моделей и моделей с тренировкой нейросетей. Мы сравнивали наши результаты с существующими методами и показали, что наш метод показывает лучшую точность и стабильность. Также мы проверили эффективность нашего метода на задаче Bayesian Total-Variation Regularized Image Deconvolution. Наши результаты демонстрируют улучшение качества семплирования, особенно при использовании вариативных матриц преобразования.
## Значимость
Наш метод имеет широкие потенциальные применения в области машинного обучения, статистики и физических моделей. Он предлагает новую архитектуру для эффективного семплирования, что может позволить улучшить точность решений в задачах, где требуется использование Гиббсовых законов распределения. Это может привести к улучшению качества результатов в задачах обработки изображений, физики и других областях, где требуется эффективное семплирование.
## Выводы
Мы предложили новый подход к семплированию, основанный на preconditioned regularized Wasserstein proximal. Этот подход показал существенное улучшение стабильности и точности в сравнении с существующими методами. Мы также показали, что наш метод может быть применен в различных задачах, включая варианты с негладкими потенциалами и различными нейронными сетями. Будущие исследования будут сфокусиро
Annotation:
We consider sampling from a Gibbs distribution by evolving finitely many
particles. We propose a preconditioned version of a recently proposed
noise-free sampling method, governed by approximating the score function with
the numerically tractable score of a regularized Wasserstein proximal operator.
This is derived by a Cole--Hopf transformation on coupled anisotropic heat
equations, yielding a kernel formulation for the preconditioned regularized
Wasserstein proximal. The diffusion component of...
📄 Stochastic Gradients under Nuisances
2025-08-29Авторы:
Facheng Yu, Ronak Mehta, Alex Luedtke, Zaid Harchaoui
## Контекст
Область исследования связана с методами стохастического градиентного оптимизации, которые широко используются в различных сферах, от классического машинного обучения до современных подходов в области самостоятельного обучения. Одна из проблем в этой области заключается в том, что некоторые обучающие процессы зависят от неизвестных нюансов (nuisances), которые могут затруднять достижение оптимальных результатов. Мотивацией для данных исследований является развитие методов, позволяющих стохастическим градиентным алгоритмам достигать хороших результатов даже при наличии таких нюансов.
## Метод
Авторы предлагают рассмотреть стохастические градиентные алгоритмы в ситуациях, когда оптимизируемый функционал зависит от неизвестных нюансов. Они исследуют условия, при которых данные алгоритмы могут по-прежнему достигать приемлемых результатов. Особое внимание уделено понятию Neyman-ортогональности, которое позволяет оценить влияние нюансов на оптимизационный процесс. Кроме того, предложена разработка вариантов алгоритмов с приближенно ортогональными обновлениями, которые могут компенсировать влияние нюансов и поддерживать близкие к классическим стохастическим градиентам результаты.
## Результаты
Исследования проводились с использованием синтетических и реальных данных. Авторы проверили эффективность своих методов на примерах из области статистического обучения и двойного машинного обучения. Для оценки производительности использовались метрики, такие как скорость сходимости и точность решения. Результаты показали, что при удовлетворении условия Neyman-ортогональности стохастические градиенты могут достичь оптимальных результатов. В случае, когда условие не выполняется, вариант с приближенно ортогональными обновлениями показал приемлемые результаты, уменьшая влияние нюансов на оптимизацию.
## Значимость
Предложенные методы могут применяться в ситуациях, когда задачи обучения зависят от неизвестных нюансов. Они демонстрируют высокую потенциальную полезность в области самостоятельного обучения, обработки нестандартных данных и двойного машинного обучения. Основное преимущество заключается в улучшении устойчивости и эффективности стохастических градиентных алгоритмов при оптимизации задач, где нюансы могут существенно повлиять на результаты. Это может привести к более надежным и предсказуемым результатам в различных практических сценариях.
## Выводы
Изучение влияния нюансов на стохастические градиентные алгоритмы позволило установить условия, при которых данные алгоритмы все же могут достичь приемлемых результатов
Annotation:
Stochastic gradient optimization is the dominant learning paradigm for a
variety of scenarios, from classical supervised learning to modern
self-supervised learning. We consider stochastic gradient algorithms for
learning problems whose objectives rely on unknown nuisance parameters, and
establish non-asymptotic convergence guarantees. Our results show that, while
the presence of a nuisance can alter the optimum and upset the optimization
trajectory, the classical stochastic gradient algorithm m...
Авторы:
Taos Transue, Bohan Chen, So Takao, Bao Wang
#################################
## Контекст
#################################
Данные ассимиляции (Data Assimilation, DA) — это проблема последовательного оценивания состояния динамической системы с использованием шумных наблюдений. Недавние достижения в области генерируемых моделей способствовали развитию новых подходов к решению DA в высокомерных нелинейных системах, в том числе на основе ensemble score filter (EnSF). Однако эти новые подходы связаны с высокой вычислительной нагрузкой из-за медленной создания выборок. В данной статье предлагается новый подход к фильтрации на основе flow matching (FM), который называется ensemble flow filter (EnFF). Этот метод ускоряет создание выборок и позволяет гибко проектировать векторные поля (VF). Он является тренировочной-бесплатной DA-методологией, интегрирующей оценочные методы Монте-Карло (MC) для маргинального векторного поля (VF) и локализованной наблюдательной навигации. EnFF обеспечивает более быструю фильтрацию и гибкость в проектировании VF по сравнению с другими подходами генерируемых моделей в DA.
#################################
## Метод
#################################
Методом EnFF является фильтрация на основе flow matching (FM), который включает в себя оценочные методы Monte Carlo (MC) для маргинального векторного поля (VF) и локализованной навигации. Основной идеей является использование максимальной правдоподобности (maximum likelihood) для построения маргинального VF, используя данные Монте-Карло. Это позволяет сформировать векторное поле (VF) из нескольких подвыборок, чтобы улучшить возможности оценки генерируемых моделей. Архитектура EnFF также включает в себя локализованные шаги, которые улучшают возможности масштабирования, позволяя использовать большие модели с высоким разрешением. Метод EnFF является простым в реализации и не требует тренировки, что делает его эффективным для DA в высокомерных системах.
#################################
## Результаты
#################################
В экспериментах, проведенных на высокомерных бенчмарках данных, EnFF продемонстрировал значительное улучшение в соотношении скорости/точности в сравнении с собственными подходами, такими как ensemble score filter (EnSF) и ensemble Kalman filter (EnKF). Использование больших моделей с высоким разрешением позволило EnFF использовать большие выборки во время фильтрации. Это также позволило улучшить точность фильтрации в высокомерных динамических системах. Эксперименты показывают, что EnFF может быть эффективно использован в высокомерных DA благодаря быстрому созданию выборок и гибкому проектированию VF.
#################################
## Значимость
#################################
EnFF может быть применен в различных областях, например в моделировании климата, в экономике, в моделировании динамических систем. Он позволяет эффективно использовать большие выборки в DA, что улучшает точность и устойчивость моделей в высокомерных сист
Annotation:
Data assimilation (DA) is the problem of sequentially estimating the state of
a dynamical system from noisy observations. Recent advances in generative
modeling have inspired new approaches to DA in high-dimensional nonlinear
settings, especially the ensemble score filter (EnSF). However, these come at a
significant computational burden due to slow sampling. In this paper, we
introduce a new filtering framework based on flow matching (FM) -- called the
ensemble flow filter (EnFF) -- to accelerat...
📄 A pseudo-inverse of a line graph
2025-08-15Авторы:
Sevvandi Kandanaarachchi, Philip Kilby, Cheng Soon Ong
## Контекст
Область исследования связана с теорией графов и их преобразованиями. Графы являются основным инструментом в математике, компьютерных науках и естественных науках для моделирования структурных и логических связей. Одним из интересных преобразований является превращение графа в его линейный граф (line graph). Линейный граф представляет собой вершины оригинального графа как рёбра нового графа. Однако не все графы имеют линейный граф, что делает преобразование необратимым. Это ограничение мотивирует рассмотрение возможности реконструировать оригинальный граф из его линейного графа с минимальными правками, определяя таким образом псевдообратную операцию. Это имеет значение в задачах графной теории, компьютерного зрения и других областях, где графы используются для моделирования.
## Метод
Работа основывается на оптимизационной модели, которая предлагает решение задачи нахождения псевдообратного линейного графа. Основная идея заключается в том, чтобы найти минимальное число редакций рёбер в линейном графе, чтобы получить оригинальный граф. Используется линейная интегральная программа для оптимизации этой задачи. Для теоретической валидации гипотезы о работе этой модели применяется норма спектра графа. Эмпирические эксперименты проводятся с использованием графов Эрдеша-Реньи, чтобы проверить эффективность метода на реальных данных.
## Результаты
На основе использованных данных (графов Эрдеша-Реньи), эксперименты показывают, что прогнозируемые теоретические результаты о работе модели соответствуют реальному поведению. Метод позволяет восстановить оригинальный граф с минимальными изменениями в линейном графе. Эксперименты также подтверждают, что псевдообратная операция оптимальна в заданных предположениях. Эти результаты эмпирически подтверждают теоретический подход к решению задачи.
## Значимость
Полученные результаты имеют значение для многих областей, где графы используются для моделирования. Метод может применяться в графной теории для разбора и восстановления структуры графов. Также может быть полезен в области графного зрения, анализа сетей и других приложениях. Особым преимуществом является то, что этот подход минимизирует изменения в линейном графе, чтобы восстановить оригинальный, что является эффективным и точным. Это может иметь большой потенциальный вклад в развитие теории графов и её приложений.
## Выводы
В итоге был предложен метод для решения задачи восстановления оригинального графа из его линейного графа с минимальными редакциями. Экс
Annotation:
Line graphs are an alternative representation of graphs where each vertex of
the original (root) graph becomes an edge. However not all graphs have a
corresponding root graph, hence the transformation from graphs to line graphs
is not invertible. We investigate the case when there is a small perturbation
in the space of line graphs, and try to recover the corresponding root graph,
essentially defining the inverse of the line graph operation. We propose a
linear integer program that edits the sma...
Авторы:
Bogdan Butyrin, Artemy Rubtsov, Alexey Naumov, Vladimir Ulyanov, Sergey Samsonov
## Контекст
Теория стохастических алгоритмов играет ключевую роль в многих областях, включая теорию управления, статистику, машинное обучение и искусственный интеллект. Одной из важных задач является изучение градиентных методов стохастической аппроксимации, которые используются для решения задач оптимизации в ситуациях, где доступ к функции оптимизации ограничен. Одним из таких методов является двухвариационный градиентный метод (Two-Timescale Stochastic Approximation, TTSA), который применяется в ситуациях, когда различные компоненты системы обновляются с разными скоростями. Несмотря на широкое применение TTSA, существуют недостатки в понимании ограничений и ошибок в нормальной аппроксимации, особенно в сложных сценариях с нелинейными моделями и мартингальным шумом. Наша цель — разработать более точные ограничения для нормальной аппроксимации TTSA в различных режимах работы.
## Метод
Мы используем метод градиентной стохастической аппроксимации с двумя временными скейлами. Для того чтобы изучить нормальную аппроксимацию, мы разрабатываем теоретические ограничения для двух режимов работы: линейной аппроксимации последнего итерационного шага и Polyak-Ruppert averaging. Для этого мы применяем методы теории вероятности, в частности, теорию Липшица и мартингальные оценки. Основная техническая сложность заключается в том, что нужно учесть взаимодействие между быстрым и медленным временными скейлами. Для этого мы используем методы центральной предельной теоремы и методы скользящих средних для получения точных оценок.
## Результаты
Мы демонстрируем, что нормальная аппроксимация TTSA работает лучше в режиме с большим разграничением между скоростями временных скейлов. Тем не менее, в режиме Polyak-Ruppert averaging нормальная аппроксимация хуже работает, когда разрыв между скоростями становится очень большим. Мы также получаем высокопорядковые моменты для ошибки алгоритма, которые могут быть полезны для дальнейшего изучения системы. Наши результаты основываются на теоретических расчетах, а также на экспериментальных исследованиях, в которых мы проверяли эффективность нашей теории на реальных данных.
## Значимость
Наши работы имеют широкое применение в многих областях, включая машинное обучение, оптимизацию и искусственный интеллект. Мы показываем, что нормальная аппроксимация TTSA может быть эффективно применена в ситуациях, где необходимо оценить распределение решений, но при этом могут быть затруднения в получении точных аппроксимаций. Изучение данной темы может привести к новым возможностям в развитии сто
Annotation:
In this paper, we establish non-asymptotic bounds for accuracy of normal
approximation for linear two-timescale stochastic approximation (TTSA)
algorithms driven by martingale difference or Markov noise. Focusing on both
the last iterate and Polyak-Ruppert averaging regimes, we derive bounds for
normal approximation in terms of the convex distance between probability
distributions. Our analysis reveals a non-trivial interaction between the fast
and slow timescales: the normal approximation rate ...
Авторы:
Zhongjun Zhang, Shipra Agrawal, Ilan Lobel, Sean R. Sinclair, Christina Lee Yu
#### Контекст
Рассмотрим Markov decision processes (MDPs) с бесконечным горизонтом и средним издержанием. Эти модели широко применяются в операционном исследовании, например, в управлении инвентарем, системах очередей и планировании производства. Одна из основных задач в таких моделях — найти политику, минимизирующую средний издержаний. Однако найти эффективную политику без дополнительного интерактивного взаимодействия с системой является сложной задачей. Большинство существующих подходов требуют большого количества итераций, что может быть неэффективно в реальном времени. Мы предлагаем новый подход, использующий частичный порядок над классом политик, что позволяет эффективно использовать данные, собранные под одним политикой для оценки политик, относящихся к другой.
#### Метод
Мы предлагаем алгоритм реквизитов, основанный на подходе "epoch-based". Данный подход использует частичный порядок над классом политик, чтобы обеспечить "counterfactual inference", то есть использовать данные, собранные под одной политикой, для оценки другой. Это позволяет уменьшить количество необходимых итераций и улучшить эффективность алгоритма. Наша методология включает три основных этапа:
1. Определение частичного порядка над политиками.
2. Разработка алгоритма, который использует этот порядок для эффективного обучения.
3. Использование полученных данных для проверки и сравнения политик.
Данный подход позволяет получить регрет-зависимость $O(\sqrt{w \log(|\Theta|) T})$, где $w$ — ширина частичного порядка, а $|\Theta|$ — размер класса политик. Особенностью этого подхода является то, что регрет не зависит от размера состояний и действий, что делает его эффективным для больших систем.
#### Результаты
Мы применили нашу модель к нескольким задачам из операционного исследования, включая управление инвентарем и моделирование очередей. Для каждой задачи, мы показали, что алгоритм достигает новых теоретических гарантий и демонстрирует сильные эмпирические результаты. Например, в модели управления инвентарем мы доказали, что наш алгоритм может уменьшить средний издержаний без дополнительных интервактивных данных. Также, в модели очередей, мы показали, что политики, полученные с помощью нашего алгоритма, выполняются эффективнее, независимо от структуры запросов или структуры запросов. Эти результаты подтверждают эффективность нашей модели в различных сценариях.
#### Значимость
Наш подход имеет широкие применения в различных областях операционного исследования. Он может быть использован для улучшения решений в управлении инвентарем, моделировании очередей и других задача
Annotation:
We propose an epoch-based reinforcement learning algorithm for
infinite-horizon average-cost Markov decision processes (MDPs) that leverages a
partial order over a policy class. In this structure, $\pi' \leq \pi$ if data
collected under $\pi$ can be used to estimate the performance of $\pi'$,
enabling counterfactual inference without additional environment interaction.
Leveraging this partial order, we show that our algorithm achieves a regret
bound of $O(\sqrt{w \log(|\Theta|) T})$, where $w$ i...
Авторы:
Ilya Levin, Alexey Naumov, Sergey Samsonov
Исследование рассматривает Linear Stochastic Approximation (LSA) с Polyak-Ruppert (PR) алгоритмом, оптимизированным для Markovian noise. Авторы исследуют bias и high-order error bounds с постоянным шагом $\alpha$ и предлагают новую декомпозицию bias с помощью линеаризации. Они показывают, что leading-order term $\alpha$-зависим и не выравнивается PR-алгоритмом. Для решения этой проблемы, используется Richardson-Romberg (RR) extrapolation, которая эффективно устраняет этот bias. Авторы также разрабатывают high-order moment bounds для RR-итераций и показывают, что лидирующий error-term находится в соответствии с asymptotically optimal covariance matrix в vanilla-averaged LSA. Эти результаты демонстрируют, что RR-extrapolation может улучшить точность и понизить ошибки в Markovian LSA.
Annotation:
In this paper, we study the bias and high-order error bounds of the Linear
Stochastic Approximation (LSA) algorithm with Polyak-Ruppert (PR) averaging
under Markovian noise. We focus on the version of the algorithm with constant
step size $\alpha$ and propose a novel decomposition of the bias via a
linearization technique. We analyze the structure of the bias and show that the
leading-order term is linear in $\alpha$ and cannot be eliminated by PR
averaging. To address this, we apply the Richard...
Показано 11 -
18
из 18 записей