📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Optimization and Regularization Under Arbitrary Objectives

2025-11-26

Авторы:

Jared N. Lakhani, Etienne Pienaar

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

This study investigates the limitations of applying Markov Chain Monte Carlo (MCMC) methods to arbitrary objective functions, focusing on a two-block MCMC framework which alternates between Metropolis-Hastings and Gibbs sampling. While such approaches are often considered advantageous for enabling data-driven regularization, we show that their performance critically depends on the sharpness of the employed likelihood form. By introducing a sharpness parameter and exploring alternative likelihood...

ID: 2511.19628v1 stat.ML, cs.LG, stat.CO

arXiv PDF

📄 Learning Paths for Dynamic Measure Transport: A Control Perspective

2025-11-08

Авторы:

Aimee Maurais, Bamdad Hosseini, Youssef Marzouk

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

We bring a control perspective to the problem of identifying paths of measures for sampling via dynamic measure transport (DMT). We highlight the fact that commonly used paths may be poor choices for DMT and connect existing methods for learning alternate paths to mean-field games. Based on these connections we pose a flexible family of optimization problems for identifying tilted paths of measures for DMT and advocate for the use of objective terms which encourage smoothness of the correspondin...

ID: 2511.03797v1 stat.ML, cs.LG, stat.CO

arXiv PDF

📄 Online Bayesian Experimental Design for Partially Observed Dynamical Systems

2025-11-08

Авторы:

Sara Pérez-Vieites, Sahel Iqbal, Simo Särkkä, Dominik Baumann

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Bayesian experimental design (BED) provides a principled framework for optimizing data collection, but existing approaches do not apply to crucial real-world settings such as dynamical systems with partial observability, where only noisy and incomplete observations are available. These systems are naturally modeled as state-space models (SSMs), where latent states mediate the link between parameters and data, making the likelihood -- and thus information-theoretic objectives like the expected in...

ID: 2511.04403v1 stat.ML, cs.LG, stat.CO

arXiv PDF

📄 A Frequentist Statistical Introduction to Variational Inference, Autoencoders, and Diffusion Models

2025-10-23

Авторы:

Yen-Chi Chen

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

While Variational Inference (VI) is central to modern generative models like Variational Autoencoders (VAEs) and Denoising Diffusion Models (DDMs), its pedagogical treatment is split across disciplines. In statistics, VI is typically framed as a Bayesian method for posterior approximation. In machine learning, however, VAEs and DDMs are developed from a Frequentist viewpoint, where VI is used to approximate a maximum likelihood estimator. This creates a barrier for statisticians, as the principl...

ID: 2510.18777v1 stat.ML, cs.LG, stat.CO, stat.ME

arXiv PDF

📄 Learning Latent Energy-Based Models via Interacting Particle Langevin Dynamics

2025-10-16

Авторы:

Joanna Marks, Tim Y. J. Wang, O. Deniz Akyildiz

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

We develop interacting particle algorithms for learning latent variable models with energy-based priors. To do so, we leverage recent developments in particle-based methods for solving maximum marginal likelihood estimation (MMLE) problems. Specifically, we provide a continuous-time framework for learning latent energy-based models, by defining stochastic differential equations (SDEs) that provably solve the MMLE problem. We obtain a practical algorithm as a discretisation of these SDEs and prov...

ID: 2510.12311v1 stat.ML, cs.LG, stat.CO

arXiv PDF

📄 Stochastic Path Planning in Correlated Obstacle Fields

2025-09-26

Авторы:

Li Zhou, Elvan Ceyhan

#### Контекст Планирование путей в помехах является ключевым проблемой в автоматизации, искусственном интеллекте и робототехнике. Особенно сложной является задача навигации в помещениях с неоднородными, скоррелированными препятствиями и нестабильными сенсорными данными. Избирательное использование сенсора для получения дополнительных сведений о труднодоступных областях помогает снизить неопределенность, но накладывает дополнительные затраты на время и ресурсы. Исследование задач планирования путей в помещениях с коррелированными препятствиями проводится для улучшения решений в условиях нестабильности и неопределенности. #### Метод Мы предлагаем модель **Stochastic Correlated Obstacle Scene (SCOS)**, основанную на **Gaussian Random Field (GRF)** для представления корреляции препятствий. Сенсоры собирают неточные данные о блокировках, а алгоритмы Bayesian belief update используются для уточнения блокировочных вероятностей. Для нахождения оптимального пути вводится двухэтапный фреймворк: в первой стадии происходит оптимизация политики с использованием **Optimistic Policy Iteration** и **Information Bonus** для поиска наиболее информативных регионов. Во второй стадии применяется онлайн-политика с регулярными обновлениями базовой политики на основе механизма Байеса, адаптирующегося к новым данным. Метод поддерживает распределенное обучение полными распределениями затрат, что улучшает квантование неопределенности. #### Результаты Наши эксперименты проводились на различных симулированных маппах с разным разрешением и плотностью препятствий. Мы сравнивали нашу модель со стандартными методами, такими как Value Iteration, Monte Carlo Tree Search и Distributional RL. Модель SCOS показала значительное сокращение потребленных ресурсов при одновременном повышении точности и скорости нахождения пути. Для оценки адаптивности использовались сценарии с адверсариальными препятствиями и случайными помехами. Результаты показали, что наш алгоритм превосходит базовые методы в области эффективности и надежности. #### Значимость Наша модель может быть применена в различных сферах, включая навигацию роботов в закрытых помещениях, планирование в условиях сбоев сети, а также в задачах мониторинга и очистки природных хаотических объектов. Отличительным преимуществом является возможность учета корреляции препятствий, что позволяет повысить точность и эффективность планирования. Развитие данной модели может привести к улучшению безопасности и эффективности в системах автоматического управления. #### Выводы Мы представили модель SCOS для планирования путей в помещениях с коррелированными препятствиями и нестабильными сенсорными данными. Наша модель использует Байесовские обновления вероятностей и двухэ

Annotation:

We introduce the Stochastic Correlated Obstacle Scene (SCOS) problem, a navigation setting with spatially correlated obstacles of uncertain blockage status, realistically constrained sensors that provide noisy readings and costly disambiguation. Modeling the spatial correlation with Gaussian Random Field (GRF), we develop Bayesian belief updates that refine blockage probabilities, and use the posteriors to reduce search space for efficiency. To find the optimal traversal policy, we propose a nov...

ID: 2509.19559v1 stat.ML, cs.LG, stat.CO

arXiv PDF

📄 Diffusion and Flow-based Copulas: Forgetting and Remembering Dependencies

2025-09-26

Авторы:

David Huk, Theodoros Damoulas

## Контекст Область исследования сосредоточена на моделировании многомерных зависимостей в данных с помощью copulas. Эти модели широко применяются в различных областях, включая финансы, биологию и компьютерное зрение. Однако существующие модели страдают от ограниченности аппарата и сложности масштабирования для высокомерных и многомодальных данных. Эти проблемы возникают из-за рестриктивных предположений, которые не подходят для решения задач, требующих точного понимания зависимостей в сложных наборах данных. Мотивация для данного исследования заключается в развитии более гибких и эффективных моделей copulas, которые могут справляться с вызовами современных задач. ## Метод Предлагаемые методы основываются на принципах диффузии и потоков, которые допускают управляемое забывание зависимостей между переменными. Две основные процедуры — ForgetCopula и SampleCopula — демонстрируют, как зависимости между переменными могут быть постепенно забыты, оставив распределения по отдельным переменным неизменными. Эти процессы гарантируют, что результирующие модели остаются валидными copulas. Для восстановления забытых зависимостей используется метод обучения, который позволяет модели оптимально восстановить исходные copulas. Две основные реализации различаются по фокусу: первая — на прямом данности, а вторая — на эффективном сэмплировании. ## Результаты Эксперименты проводились на наборах данных, включающих сложные и высокомерные зависимости, такие как симуляции из научных областей и изображения. Наше решение показало значительное превосходство над существующими копулярными моделями в терминах точности моделирования зависимостей и эффективности работы. Мы демонстрируем, что наша модель способна справляться с задачами, в которых простые copulas или другие модели столкнулись с трудностями. Эмпирические результаты подтверждают высокую точность и масштабируемость наших методов в моделировании сложных зависимостей. ## Значимость Промышленные приложения, включая финансовый мониторинг, биологический анализ и компьютерное зрение, могут выгодно использовать нашу модель для обработки многомерных и нетривиальных зависимостей. Наша модель предлагает выигрыш в точности и масштабируемости, открывая новые возможности для применения copulas в задачах, где ранее они не были применимы. Это демонстрирует возможность использования нашего подхода для решения задач с высокой сложностью, которые требуют точных моделей зависимостей. ## Выводы Мы представили методы Diffusion and Flow-based Copulas, которые представляют собой первый подход к моделированию copulas, основанный на забывании и восстановлении зависимостей. Наши результаты показали превосходство

Annotation:

Copulas are a fundamental tool for modelling multivariate dependencies in data, forming the method of choice in diverse fields and applications. However, the adoption of existing models for multimodal and high-dimensional dependencies is hindered by restrictive assumptions and poor scaling. In this work, we present methods for modelling copulas based on the principles of diffusions and flows. We design two processes that progressively forget inter-variable dependencies while leaving dimension-wi...

ID: 2509.19707v1 stat.ML, cs.LG, stat.CO, stat.ME

arXiv PDF

📄 A Gradient Flow Approach to Solving Inverse Problems with Latent Diffusion Models

2025-09-25

Авторы:

Tim Y. J. Wang, O. Deniz Akyildiz

## Контекст Поиск решений для задач неоднозначного инверсии является ключевым вопросом в математической и прикладной математике, а также в областях, таких как инженерия, физика и биология. Эти задачи часто требуют нахождения скрытых параметров или характеристик системы на основе неполных или шумных наблюдений. Одним из основных препятствий является отсутствие эффективных закономерностей или предварительных знаний, которые могли бы облегчить решение. Несмотря на некоторые успехи, существуют значительные трудности в создании универсальных и гибких моделей, способных адаптироваться к различным типам задач и иметь высокую точность. Недавно появилось интерес к использованию глубоких нейронных сетей, особенно сверточных моделей, для решения таких задач. Однако, эти модели часто требуют большого количества данных для обучения и требуют значительных вычислительных ресурсов. Многие из них также не являются универсальными и требуют переобучения для каждой конкретной задачи. В этом исследовании рассматривается новая подходная модель, основанная на теории градиентных потоков, которая предлагает новый подход к решению этой проблемы. ## Метод В этой работе предлагается новая методология, названная Diffusion-regularized Wasserstein Gradient Flow (DWGF), для решения задач неоднозначного инверсии. Основная теоретическая основа заключается в формализме градиентного потока в латентном пространстве, который использует предобученную модель стиса стиса стиса (StableDiffusion) в качестве модели предложения. Данная модель градиентного потока построена на основе Kullback-Leibler (KL) дивергенции в латентном пространстве. Для реализации DWGF используется архитектура, состоящая из нескольких ключевых элементов. Во-первых, используется предобученная модель StableDiffusion для генерации латентных пространств. Во-вторых, вводится новая операция регуляризации, которая позволяет оптимизировать решения с учетом заданных ограничений. В-третьих, используется метод регулярного градиентного потока, который позволяет стабилизировать решение и избежать локальных минимумов. Эта модель является тренировочно-свободной, что означает, что она не требует дополнительного обучения для каждой конкретной задачи. Вместо этого она использует существующую модель StableDiffusion и адаптирует ее к новой задаче с помощью градиентного потока. Это уникальное решение позволяет эффективно решать задачи неоднозначного инверсии с меньшим вычислительным вкладом и более высокой точностью. ## Результаты Для оценки эффективности DWGF были проведены эксперименты на стандартных бенчмарках, используя StableDiffusion в качестве модели предло

Annotation:

Solving ill-posed inverse problems requires powerful and flexible priors. We propose leveraging pretrained latent diffusion models for this task through a new training-free approach, termed Diffusion-regularized Wasserstein Gradient Flow (DWGF). Specifically, we formulate the posterior sampling problem as a regularized Wasserstein gradient flow of the Kullback-Leibler divergence in the latent space. We demonstrate the performance of our method on standard benchmarks using StableDiffusion (Rombac...

ID: 2509.19276v1 stat.ML, cs.LG, stat.CO

arXiv PDF

📄 Kernel K-means clustering of distributional data

2025-09-24

Авторы:

Amparo Baíllo, Jose R. Berrendero, Martín Sánchez-Signorini

## Контекст Исследование посвящено проблеме кластеризации выборок распределений вероятности в $\mathbb R^p$, где $p>1$. Такие распределения часто встречаются в сложных областях данных, таких как геометрическое образование изображений и сингулярные распределения. Несмотря на их важность, кластеризация распределений остается недостаточно исследована. Основная цель работы — развить эффективный метод кластеризации, который может быть применен в таких областях. ## Метод Метод кластеризации основывается на использовании кернельных методов, а именно, реproducing kernel Hilbert space (RKHS). Каждое распределение представляется в виде своего ядерного ожидания в $\mathcal H$. Данные, представленные в RKHS, классифицируются с помощью алгоритма К-средних ($K$-means). Основной вклад метода заключается в том, что он использует положительно определенный ядерный метод $k$ для преобразования распределений в пространство RKHS, где процедура кластеризации выполняется. Этот подход является простым, гибким и может использоваться для кластеризации выборок распределений в высоком измерении $p$. ## Результаты Работа включает моделирование и экспериментирование с алгоритмом $K$-means на кернельных представлениях распределений. Для этого использовались синтетические данные и реальная выборка SAR-изображений. Отдельное внимание уделено выбору ядра и его гиперпараметров, так как это влияет на качество кластеризации. Результаты симуляций показали хорошую работу метода в различных условиях, в том числе при кластеризации высокомерных распределений. ## Значимость Предложенный подход может применяться в различных областях, где кластеризация распределений важна. Например, в обработке изображений, геологии, финансах, и других. Одним из преимуществ является то, что он легко адаптируется к различным типам распределений и имеет высокую скорость кластеризации. Это делает его полезным для решения практических задач. ## Выводы Работа предлагает эффективный метод кластеризации распределений, основанный на ядерном подходе. Проведенные эксперименты показали высокую эффективность метода в кластеризации высокомерных распределений. В дальнейшем, можно рассмотреть адаптацию этого метода для решения других задач кластеризации, в том числе в сложных высокомерных пространствах.

Annotation:

We consider the problem of clustering a sample of probability distributions from a random distribution on $\mathbb R^p$. Our proposed partitioning method makes use of a symmetric, positive-definite kernel $k$ and its associated reproducing kernel Hilbert space (RKHS) $\mathcal H$. By mapping each distribution to its corresponding kernel mean embedding in $\mathcal H$, we obtain a sample in this RKHS where we carry out the $K$-means clustering procedure, which provides an unsupervised classificat...

ID: 2509.18037v1 stat.ML, cs.LG, stat.CO

arXiv PDF

📄 A Particle-Flow Algorithm for Free-Support Wasserstein Barycenters

2025-09-17

Авторы:

Kisung You

## Контекст В поле видимости статистических моделей и анализа данных, рассматривается понятие **Wasserstein barycenter**, которое представляет собой расширение Евклидового среднего до множества вероятностных мер. Оно определяется как минимум задачи усреднения весовой суммы квадратов 2-Wasserstein-дисторбансов. Эта концепция находит приложение в задачах кластеризации, статистического обучения и работе с изображениями. Однако существующие методы, такие как регуляризация с помощью энтропии, ограничивают точность и стабильность решений. Мотивирует разработку новых подходов, которые были бы более строгими и эффективными. ## Метод Разработан **новый подход**, основанный на геометрической модели шаровых пространств, для вычисления Wasserstein barycenter. Без использования энтропии, метод использует **формальную римановскую геометрию** Wasserstein-пространства. Атомы барицентра, как частицы, двигаются по траекториям, возникающим из **адвекции в среднем по транспортным планам**. В случае отсутствия **Monge-переносов**, применяются **barycentric projections**. Этот подход позволяет сохранить геометрические особенности входных данных с минимальными вычислительными затратами. ## Результаты Использованы синтетические и реальные данные для проверки алгоритма. На синтетических данных показана четкость решений и точность алгоритма. На реальных данных (кластеризация изображений, байесовский анализ, агрегация постероритетов) получены результаты, которые демонстрируют **высокую точность** и **устойчивость** к погрешностям в данных. Алгоритм показал **гармоническое сочетание точности и производительности**, становясь конкурентоспособным в сравнении с традиционными методами. ## Значимость Полученный метод находит применение в **статистическом анализе**, **машинном обучении**, **графическом дизайне**. Он обеспечивает **высокую точность**, **устойчивость** и **уменьшает вычислительные затраты**. Благодаря принципиально новому подходу, алгоритм может использоваться в **больших масштабах** и в **реальном времени**, увеличивая эффективность в решении задач усреднения вероятностных мер. ## Выводы Разработанный **particle-flow-алгоритм** представляет собой **новый стандарт** для вычисления Wasserstein barycenter. Он комбинирует **точность**, **эффективность** и **теоретическую строгость**. Будущие исследования будут сконцентрированы на расширении применимости и оптимизации алгоритма для **больших данных** и **реального времени**.

Annotation:

The Wasserstein barycenter extends the Euclidean mean to the space of probability measures by minimizing the weighted sum of squared 2-Wasserstein distances. We develop a free-support algorithm for computing Wasserstein barycenters that avoids entropic regularization and instead follows the formal Riemannian geometry of Wasserstein space. In our approach, barycenter atoms evolve as particles advected by averaged optimal-transport displacements, with barycentric projections of optimal transport p...

ID: 2509.11435v2 stat.ML, cs.LG, stat.CO

arXiv PDF

Показано 1 - 10 из 15 записей