📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Youngjoo Yun, Rishabh Dudeja

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
In differential privacy, statistics of a sensitive dataset are privatized by introducing random noise. Most privacy analyses provide privacy bounds specifying a noise level sufficient to achieve a target privacy guarantee. Sometimes, these bounds are pessimistic and suggest adding excessive noise, which overwhelms the meaningful signal. It remains unclear if such high noise levels are truly necessary or a limitation of the proof techniques. This paper explores whether we can obtain sharp privacy...
ID: 2511.07270v1 math.ST, cs.IT, cs.LG, math.PR, stat.ML
Авторы:

Thomas van Vuren, Fiona Sloothaak, Maarten G. Wolf, Jaron Sanders

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
The curse of dimensionality renders Reinforcement Learning (RL) impractical in many real-world settings with exponentially large state and action spaces. Yet, many environments exhibit exploitable structure that can accelerate learning. To formalize this idea, we study RL in Block Markov Decision Processes (BMDPs). BMDPs model problems with large observation spaces, but where transition dynamics are fully determined by latent states. Recent advances in clustering methods have enabled the efficie...
ID: 2510.13748v1 cs.LG, math.PR, stat.ML, 90C40, 62H30, 60J20
Авторы:

Satoshi Hayakawa, Yuhta Takida, Masaaki Imaizumi, Hiromi Wakaki, Yuki Mitsufuji

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Masked diffusion models have shown promising performance in generating high-quality samples in a wide range of domains, but accelerating their sampling process remains relatively underexplored. To investigate efficient samplers for masked diffusion, this paper theoretically analyzes the MaskGIT sampler for image modeling, revealing its implicit temperature sampling mechanism. Through this analysis, we introduce the "moment sampler," an asymptotically equivalent but more tractable and interpretab...
ID: 2510.04525v1 cs.LG, math.PR, stat.ML
Авторы:

Giuseppe Bruno, Federico Pasqualotto, Andrea Agazzi

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
In this paper, we study the evolution of tokens through the depth of encoder-only transformer models at inference time by modeling them as a system of particles interacting in a mean-field way and studying the corresponding dynamics. More specifically, we consider this problem in the moderate interaction regime, where the number $N$ of tokens is large and the inverse temperature parameter $\beta$ of the model scales together with $N$. In this regime, the dynamics of the system displays a multisc...
ID: 2509.25040v1 cs.LG, math.PR, stat.ML
Авторы:

Samuel Boïté, Eloi Tanguy, Julie Delon, Agnès Desolneux, Rémi Flamary

#### Контекст Область исследования сосредоточена на расширении возможностей Expectation-Maximisation (EM), широко применяемого алгоритма в статистике и машинном обучении, особенно для работы с латентными переменными, такими как Гауссовы Микседные Модели (Gaussian Mixture Models, GMM). Несмотря на свою важность, EM традиционно рассматривается как недифференцируемая структура, что ограничивает его интеграцию в современные методы машинного обучения, требующие end-to-end gradient propagation. Тем не менее, возникает потребность в интеграции EM в такие процессы, поскольку он может быть использован для обработки сложных задач, включая zeroth-order optimization, meta-learning, и динамические модели. В данной работе предлагается новый подход к дифференцированию EM, который позволяет интегрировать его в современные методы обучения. #### Метод Для достижения целей работы разработана множественная методология для дифференцирования EM. Рассмотрены и оценены различные методы: от полного автоматического дифференцирования до приближённых методов. Архитектура разработана таким образом, чтобы обеспечить точность и эффективность вычислений. Был использован широкий набор технических решений для точного вычисления градиентов в рамках EM. Методика также включает в себя решения для решения задач, связанных с GMM и optimal transport, а также для использования $\mathrm{MW}_2$ в информатических и имидж-процессинг-задачах. Особое внимание уделено теоретическим результатам, которые подкрепляют эффективность использования $\mathrm{MW}_2$ вместе с EM. #### Результаты В ходе исследования проводились эксперименты, которые подтвердили точность и эффективность разработанных методов. Использованы различные данные, включая изображения и синтетические GMM-данные. Результаты показали, что разработанный подход обеспечивает высокую точность в вычислении градиентов в рамках EM и его интеграции в $\mathrm{MW}_2$-based задачи. На примерах, таких как barycentre computation, colour and style transfer, image generation, and texture synthesis, было показано, насколько эффективно можно использовать дифференцируемый EM в различных машинно-обучающих и информатических задачах. #### Значимость Разработанный подход открывает возможности для применения EM в множестве новых областей, включая optimal transport, машинное обучение, и информатические задачи. Отдельно выделяется преимущество в том, что дифференцируемый EM может быть использован в задачах, требующих точного вычисления градиентов. В будущем могут быть рассмотрены дополнительные приложения, такие как задачи adaptive transport и другие типы optimal transport для различных медиа и данных. #### Выводы Основные достижения включают разработку и оценку различных методов дифференцирования EM, позволяющих интегрировать его в современные методы ма
Annotation:
The Expectation-Maximisation (EM) algorithm is a central tool in statistics and machine learning, widely used for latent-variable models such as Gaussian Mixture Models (GMMs). Despite its ubiquity, EM is typically treated as a non-differentiable black box, preventing its integration into modern learning pipelines where end-to-end gradient propagation is essential. In this work, we present and compare several differentiation strategies for EM, from full automatic differentiation to approximate m...
ID: 2509.02109v1 cs.LG, math.PR, stat.ML
Авторы:

Lei Jiang, Wen Ge, Niels Cariou-Kotlarek, Mingxuan Yi, Po-Yu Chen, Lingyi Yang, Francois Buet-Golfouse, Gaurav Mittal, Hao Ni

#### Контекст Diffusion models являются перспективным классом генерирующих моделей, способных достигать современных результатов в задачах создания изображений, текста и других структур. Однако их высокая сложность вычислительной нагрузки, особенно в процессе инференции, остается значимой проблемой. Одним из ключевых факторов является то, что многие диффузионные модели требуют тысячи дискретизационных шагов для адекватного создания высококачественных генерируемых выходов. Это приводит к значительным требованиям к вычислительной мощности и времени процесса. Мы предлагаем Sig-DEG (Signature-based Differential Equation Generator) — новую технологию, которая способна ускорить инференцию диффузионных моделей без существенного потери качества. #### Метод Sig-DEG является подходом на основе теории подписи для точного аппроксимации решения стохастических дифференциальных уравнений (SDE), которые лежат в основе диффузионных моделей. Подход основывается на разделении процесса диффузии на меньшие интервалы, используя частичные подписи. Эти подписи эффективно суммируют характеристики Brownian motion на каждом отрезке. Для улучшения аппроксимации взято рекуррентное решение, позволяющее достичь точности на глобальном уровне. Метод представляет дистилляцию как задачу супервизированного обучения, где Sig-DEG прогнозирует выходы фине-резолюционной диффузионной модели на подготовленном коарсите шаге. Затем, при инференции, он использует частичные подписи для быстрого генерирования, избегая требований к точному симулированию Brownian paths. #### Результаты Мы проводили эксперименты с Sig-DEG на основе различных диффузионных моделей и данных. Результаты показали, что Sig-DEG может достигать высокого качества генерируемых выходов, сопоставимого с исходными диффузионными моделями. Однако он уменьшает количество дискретизационных шагов в разы. Это позволяет ощутимо улучшить скорость и эффективность инференции. Были проведены тесты на популярных датасетах, и результаты показали, что Sig-DEG значительно сокращает время работы, не ухудшая качество результатов. #### Значимость Предложенный метод может быть применен в различных областях, где требуется эффективное создание высококачественных изображений, звуков, текстов и других структур. Он открывает широкие возможности для ускорения инференции диффузионных моделей в реальном времени, что важно для приложений, таких как онлайн-генерация изображений, видеоинтерполяция и другие задачи, требующие высокой производительности. Мы также отмечаем, что Sig-DEG позволяет значительно экономить ресурсы, де
Annotation:
Diffusion models have achieved state-of-the-art results in generative modelling but remain computationally intensive at inference time, often requiring thousands of discretization steps. To this end, we propose Sig-DEG (Signature-based Differential Equation Generator), a novel generator for distilling pre-trained diffusion models, which can universally approximate the backward diffusion process at a coarse temporal resolution. Inspired by high-order approximations of stochastic differential equa...
ID: 2508.16939v1 cs.LG, math.PR, stat.ML