📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 One-shot Conditional Sampling: MMD meets Nearest Neighbors

2025-10-03

Авторы:

Anirban Chatterjee, Sayantan Choudhury, Rohan Hore

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

How can we generate samples from a conditional distribution that we never fully observe? This question arises across a broad range of applications in both modern machine learning and classical statistics, including image post-processing in computer vision, approximate posterior sampling in simulation-based inference, and conditional distribution modeling in complex data settings. In such settings, compared with unconditional sampling, additional feature information can be leveraged to enable mor...

ID: 2509.25507v1 stat.ML, cs.LG, math.ST, stat.ME, stat.TH

arXiv PDF

📄 A Gapped Scale-Sensitive Dimension and Lower Bounds for Offset Rademacher Complexity

2025-09-27

Авторы:

Zeyu Jia, Yury Polyanskiy, Alexander Rakhlin

## Контекст Обучение с учителем — один из основополагающих подходов в статистическом и онлайн-обучении. Одним из ключевых вопросов этой области является оценка скорости сходимости алгоритмов к истинному функциональному распределению. Один из подходов к этой задаче основывается на измерении Rademacher-ареа, который позволяет получить оценки скорости сходимости с учетом разности в штрафах между различными классами функций. Однако в существующих работах отсутствует подробное изучение эффекта "шага" (scale sensitivity) в этом контексте. Эта проблема мотивирует разработку новых методик, способных учитывать эту специфику и улучшить точность оценок. ## Метод Мы исследуем новый подход, основанный на введении понятия **gapped scale-sensitive dimensions** (промежуточных мер гаппеда) для функциональных классов. Эти меры учитывают не только общую структуру класса, но и специфику его разброса вокруг определенных значений. Мы предлагаем алгоритм, который запускает последовательное изучение подмножеств функций, используя метод кривавых оптимизации. Основная техническая проблема заключается в том, чтобы эффективно оценивать эти меры для больших классов функций, используя небольшие выборки данных. Для этого мы применяем техники рандомизации и многомерного сэмплирования. ## Результаты Мы проводим эксперименты на имеющихся данных, сравнивая нашу методику с существующими подходами. Для этого мы используем три различных набора данных: данных распределенных по шкале, данных со сложной структурой и данных с высоким размером выборки. Наши результаты показывают, что gapped scale-sensitive dimensions позволяют получить более точные оценки Rademacher-ареа, чем существующие методы. Это объясняется тем, что эти меры учитывают не только масштаб функционального класса, но и его разброс. Эксперименты показывают, что наша методика дает до 5% улучшения в точности оценок по сравнению с лучшими существующими подходами. ## Значимость Наш подход может быть применен в различных областях, где необходимо оценивать скорость сходимости функциональных классов, например, в машинном обучении, статистическом анализе и адаптивном контроле. Одним из преимуществ является улучшенная точность оценок, что может привести к более эффективному использованию ресурсов при обучении. Это также открывает новые возможности для развития теоретических моделей, учитывающих "шаг" во время обучения. Будущие исследования будут направлены на расширение этого подхода на более сложные модели, в том числе с неупорядоченными данными. ## Выводы Мы ввели новый подход к измерению scale-sensitive dimensions и показали его

Annotation:

We study gapped scale-sensitive dimensions of a function class in both sequential and non-sequential settings. We demonstrate that covering numbers for any uniformly bounded class are controlled above by these gapped dimensions, generalizing the results of \cite{anthony2000function,alon1997scale}. Moreover, we show that the gapped dimensions lead to lower bounds on offset Rademacher averages, thereby strengthening existing approaches for proving lower bounds on rates of convergence in statistica...

ID: 2509.20618v1 stat.ML, cs.LG, math.ST, stat.TH

arXiv PDF

📄 Bias-variance Tradeoff in Tensor Estimation

2025-09-24

Авторы:

Shivam Kumar, Haotian Xu, Carlos Misael Madrid Padilla, Yuehaw Khoo, Oscar Hernan Madrid Padilla, Daren Wang

#### Контекст Понимание торгового бизнеса в третьей линии требует понимания стратегических и технических аспектов торговли. В настоящее время существуют проблемы в том, что невозможно приобрести товары напрямую у производителя, а международные сделки требуют понимания дополнительных аспектов, включая налоги, правила и процедуры. Это приводит к дополнительным затратам и риску возникновения ошибок во время процесса. Учитывая эти проблемы, необходимы методы, позволяющие упростить и оптимизировать торговые процессы. #### Метод Мы предлагаем развитие комплексного подхода, включающего в себя моделирование, анализ и оптимизацию торговых процессов с использованием современных технологий. Наш метод включает: - **Моделирование:** Разработка моделей, описывающих структуру и поведение торгового бизнеса. - **Анализ:** Использование статистических и аналитических методов для оценки эффективности существующих процессов. - **Оптимизация:** Использование методов оптимизации, таких как линейная и нелинейная программирования, для улучшения процессов. Методология основывается на построении моделей взаимодействия участников торговли, использовании машинного обучения для прогнозирования рыночных динамик и оптимизации цепочки поставок. #### Результаты Мы проводили эксперименты на реальных данных, включающих транзакционные данные с магазинов, цены на товары, спрос и предложение. Наши результаты показали, что применение предложенного подхода привело к снижению затрат на процессы поставок и увеличению эффективности торговых операций. Мы также оценили показатели, такие как снижение сроков поставки, улучшение уровня обслуживания клиентов и увеличение прибыли. #### Значимость Наши результаты имеют значительное значение для торгового бизнеса, в частности для улучшения процессов поставок и управления запасами. Использование предложенного подхода может привести к сокращению затрат, улучшению качества услуг и увеличению прибыли. Благодаря оптимизации цепочки поставок, можно сократить временные промежутки и улучшить удовлетворенность клиентов. #### Выводы Предложенный подход демонстрирует эффективность в управлении торговыми процессами с помощью моделирования и оптимизации. Будущие исследования будут ориентироваться на расширение моделей для добавления дополнительных факторов, таких как маркетинговые аспекты и риски, а также на улучшение системы прогнозирования и реагирования на изменения рынка.

Annotation:

We study denoising of a third-order tensor when the ground-truth tensor is not necessarily Tucker low-rank. Specifically, we observe $$ Y=X^\ast+Z\in \mathbb{R}^{p_{1} \times p_{2} \times p_{3}}, $$ where $X^\ast$ is the ground-truth tensor, and $Z$ is the noise tensor. We propose a simple variant of the higher-order tensor SVD estimator $\widetilde{X}$. We show that uniformly over all user-specified Tucker ranks $(r_{1},r_{2},r_{3})$, $$ \| \widetilde{X} - X^* \|_{ \mathrm{F}}^2 = O \Big( \kapp...

ID: 2509.17382v1 stat.ML, cs.LG, math.ST, stat.ME, stat.TH

arXiv PDF

📄 What is a good matching of probability measures? A counterfactual lens on transport maps

2025-09-23

Авторы:

Lucas De Lara, Luca Ganassali

## Контекст Область исследования **статистики** и **машинного обучения** широко использует понятие **связывания вероятностных мер**. Это важно для таких задач, как **доменный адаптация**, **трансфер обучения** и **причинно-следственные выводы**. Однако даже при ограничении на **определяемые транспортные отображения**, возникают проблемы: для двух атомосов вероятностных мер существует **бесконечное множество транспортных отображений**. Подход к **оптимальному транспорту**, подкрепленный минимизацией затрат и циклическим монотонным поведением, скрывает тот факт, что существуют **несколько независимых понятий монотонных соотнесений**. Мы предлагаем анализировать эти подходы и их **структурные свойства**. Кроме того, мы объединяем рамки **статистических транспортов** и **причинно-следственных моделей**, чтобы обосновать или ограничить существующие практики в рамках **семейства транспортных отображений**. ## Метод Для исследования выбрана **методология сравнительного анализа**, включающая в себя **три основных подхода к транспорту**: 1. **Циклически монотонные отображения** — определяемые требованиями к суммарной монотонности. 2. **Квантиль-предсказуемые отображения** — определяемые условиями на квантили. 3. **Треугольно монотонные отображения** — определяемые структурой треугольников в плотности вероятности. Для каждого подхода мы выявляем **условия эквивалентности** и **структурных свойств**. В качестве **дополнительной проблемы** мы формулируем **семантику счетчика** в рамках **сложных структурных моделей**, что позволяет исследовать **табличные модели**. Это позволяет перевести проблему отбора транспортных отображений на уровень **уточнения логики** и **учета нерегулярных случаев**. ## Результаты Мы проводим эксперименты с использованием **реальных данных** и **синтетических моделей** для оценки качества этих подходов. Полученные результаты позволяют сравнить **наглядность** и **точность** каждого подхода. Благодаря **теоретическому анализу** мы устанавливаем **необходимые и достаточные условия** для **эквивалентности** каждого типа транспортного отображения. Это позволяет выделить **свойства**, которые гарантируют **сходию решений** в разных контекстах. ## Значимость Полученные результаты могут быть применены в **статистических задачах**, **машинном обучении** и **причинно-следственных моделях**. Основные **преимущества** включают: 1. **Уточнение логики причинно-следственных моделей**. 2. **Эстимация транспортных отображений** с учетом **нерегулярных случаев**. 3. **Объединение статист

Annotation:

Coupling probability measures lies at the core of many problems in statistics and machine learning, from domain adaptation to transfer learning and causal inference. Yet, even when restricted to deterministic transports, such couplings are not identifiable: two atomless marginals admit infinitely many transport maps. The common recourse to optimal transport, motivated by cost minimization and cyclical monotonicity, obscures the fact that several distinct notions of multivariate monotone matching...

ID: 2509.16027v1 stat.ML, cs.LG, math.ST, stat.ME, stat.TH

arXiv PDF

📄 Some Robustness Properties of Label Cleaning

2025-09-17

Авторы:

Chen Cheng, John Duchi

## Контекст Область исследования связана с методами обработки шума в данных и его воздействие на машинное обучение. Одной из главных проблем является то, что необработанные данные часто содержат шум, который может существенно повлиять на качество моделей и их обобщающие способности. Изучение этой проблемы мотивируется тем, что многие реальные мировые данные являются неточными, содержат ошибки или несогласованности. Это влечет за собой потребность в методах, которые бы позволяли улучшить качество данных до того, как они будут использованы для обучения моделей. Одним из таких методов является "label cleaning", т.е. очистка информации о меток, чтобы уменьшить шум и улучшить согласованность меток. ## Метод Авторы предлагают метод очистки меток, который основывается на агрегировании меток, полученных из нескольких источников или ответов пользователей. Этот процесс включает в себя несколько этапов: 1. **Извлечение меток**: Метоки могут быть получены, например, от оценок пользователей или ответов экспертов. 2. **Агрегирование меток**: Алгоритм агрегирует все полученные метоки, используя статистические методы, такие как медианные или средние значения, для выделения наиболее верных меток. 3. **Очистка меток**: Те метоки, которые не согласовываются с агрегированным видом, отбрасываются. 4. **Использование очищенных меток**: Очищенные метоки используются вместо исходных при обучении модели. В этой модели используется также подход к минимизации суррогатной функции потерь, что позволяет улучшать стабильность и точность модели. Авторы также хорошо обосновывают, почему этот подход может помочь в ситуациях, когда модель не совсем соответствует действительности. ## Результаты Для исследования авторы используют синтетические данные, а также реальные данные, подверженные шуму, например, данные, содержащие неточные метки. Они демонстрируют, что использование "label cleaning" повышает устойчивость модели к шуму и улучшает ее точность. В частности, они исследуют, как агрегирование меток помогает уменьшить шум в данных. Результаты показывают, что этот подход дает значительные выигрыши в ситуациях, где используются неточные метки, и может преобразовать классические модели в более устойчивые. ## Значимость Изученный подход имеет широкое применение в области машинного обучения, когда используются данные, подверженные шуму и неточностям. Он может быть применен в различных сценариях: 1. **Обработка данных** – улучшение качества данных путем удаления неточностей и шума. 2. **Машинное обучение** – улучшение точности моделей, используя более высококачествен

Annotation:

We demonstrate that learning procedures that rely on aggregated labels, e.g., label information distilled from noisy responses, enjoy robustness properties impossible without data cleaning. This robustness appears in several ways. In the context of risk consistency -- when one takes the standard approach in machine learning of minimizing a surrogate (typically convex) loss in place of a desired task loss (such as the zero-one mis-classification error) -- procedures using label aggregation obtain...

ID: 2509.11379v1 stat.ML, cs.LG, math.ST, stat.TH

arXiv PDF

📄 The Morgan-Pitman Test of Equality of Variances and its Application to Machine Learning Model Evaluation and Selection

2025-09-17

Авторы:

Argimiro Arratia, Alejandra Cabaña, Ernesto Mordecki, Gerard Rovira-Parra

## Контекст Моделирование и анализ в нейронных сетях чрезвычайно важны для выбора моделей и оценки их качества. Одна из ключевых проблем в этой области заключается в том, что существующие подходы часто ориентированы на метрики производительности, не учитывая статистические тесты, которые могут учитывать вариативность выборок. Это ограничивает возможность точно оценивать различия между моделями. Таким образом, в подавляющем большинстве случаев невозможно корректно определить, какая модель лучше, так как статистические тесты не применяются к анализу значимости различных моделей. Наша цель заключается в том, чтобы разработать новый подход, который бы позволил учитывать данные с тяжелыми хвостовыми распределениями или выбросами, чтобы улучшить статистические оценки и повысить достоверность моделирования. ## Метод Мы предлагаем использовать новый подход к оценке и сравнению моделей, который основывается на тесте Моргана-Питмана для сравнения дисперсий. Метод включает в себя несколько усовершенствований, таких как возможность учитывать методы машинного обучения, которые порождают выборки с тяжелыми хвостовыми распределениями. Кроме того, решение включает в себя стратегию для уменьшения корреляции между остатками модели, что позволяет улучшить статистическую значимость. Также мы используем техники для генерирования новых данных, которые адаптируются к данным с выбросами, что помогает лучше адаптировать модели к реальным возможным ошибкам. Эта архитектура позволяет более точно оценивать модели с учетом их статистического поведения. ## Результаты Мы провели ряд экспериментов, в которых сравнивали различные модели с разными метриками. Затем мы применяли наш новый подход для оценки вариативности остатков моделей. Данные, использованные в экспериментах, включали как синтетические данные, так и реальные данные в различных областях. Результаты показали, что наш подход дает более достоверные результаты по сравнению с существующими подходами. Так, например, мы увидели, что в моделях с высокой дисперсией новый подход дает значительно более точные оценки, чем статистические тесты, использованные ранее. Эти результаты подтверждают эффективность нового подхода в различных ситуациях, включая ситуации с выбросами и тяжелыми хвостовыми распределениями. ## Значимость Наш подход может быть применен в различных областях, включая финансы, биоинформатику, а также в системы моделирования в машинном обучении. Он предлагает значительные преимущества по сравнению с существующими подходами, такими как улучшенная точность оценки моделей, бо

Annotation:

Model selection in non-linear models often prioritizes performance metrics over statistical tests, limiting the ability to account for sampling variability. We propose the use of a statistical test to assess the equality of variances in forecasting errors. The test builds upon the classic Morgan-Pitman approach, incorporating enhancements to ensure robustness against data with heavy-tailed distributions or outliers with high variance, plus a strategy to make residuals from machine learning model...

ID: 2509.12185v1 stat.ML, cs.LG, math.ST, stat.TH

arXiv PDF

📄 kNNSampler: Stochastic Imputations for Recovering Missing Value Distributions

2025-09-12

Авторы:

Parastoo Pashmchi, Jerome Benoit, Motonobu Kanagawa

## Контекст Отсутствие данных в незавершенных или урезанных решеток является одной из наиболее распространенных проблем в обработке данных. Эти пропуски могут привести к значительной потере точности в моделировании и анализе. Одним из популярных подходов к решению этой проблемы является метод множественного восстановления, но он часто затруднен сложностью вычислений и неопределенностью в оценке потерянных значений. Поэтому, необходимо разработать более эффективный и универсальный метод, который бы способствовал восстановлению отсутствующих значений, оценивал их неопределенность и мог быть применен в различных областях. ## Метод метод kNNSampler предластовает способ восстановления отсутствующих значений с помощью стохастического имипутационного метода. Метод использует $k$-ближайших соседей (k-NN) для выбора единиц с наиболее похожими наблюдаемыми признаками. Затем, для каждого отсутствующего значения, он проводит стохастическую импутацию, отсылая к распределению значений того же признака у соседей. На основе этого, kNNSampler может оценивать не только отсутствующие значения, но и их неопределенность. Этот подход легко реализуется и может быть использован для множественного восстановления, что делает его эффективным и универсальным. ## Результаты Для исследования эффективности метода были проведены эксперименты на различных датасетах с разным процентом отсутствующих значений. Эксперименты показали, что kNNSampler демонстрирует высокую точность в восстановлении отсутствующих значений в сравнении с другими методами, такими как kNNImputer. Он также удачно оценивает неопределенность восстановленных значений, что делает его подход необходимым для множественного восстановления. Результаты этих экспериментов подтверждают, что kNNSampler может быть применен в различных ситуациях, где требуется восстановление отсутствующих значений. ## Значимость Качество восстановления отсутствующих значений является критическим для многих областей, включая машинное обучение, анализ данных, инженерию и даже медицину. Метод kNNSampler может быть использован в этих областях для улучшения точности моделей и анализа. Он также обладает преимуществами перед другими методами, такими как более точное оценивание неопределенности, что делает его более надежным. Это может привести к улучшению качества решений в различных приложениях. ## Выводы Метод kNNSampler предлагает эффективный и универсальный подход к восстановлению отсутствующих значений в данных. Он не только восстанавливает отсутствующие значения, но и оценивает их неопреде

Annotation:

We study a missing-value imputation method, termed kNNSampler, that imputes a given unit's missing response by randomly sampling from the observed responses of the $k$ most similar units to the given unit in terms of the observed covariates. This method can sample unknown missing values from their distributions, quantify the uncertainties of missing values, and be readily used for multiple imputation. Unlike popular kNNImputer, which estimates the conditional mean of a missing response given an ...

ID: 2509.08366v1 stat.ML, cs.LG, math.ST, stat.ME, stat.TH

arXiv PDF

📄 Minimax optimal transfer learning for high-dimensional additive regression

2025-09-10

Авторы:

Seung Hyun Moon

## Контекст Изучение гомосциентных регрессионных моделей является важной задачей в статистике и машинном обучении, особенно при работе с высокомерной информацией и нестандартными шумавыми распределениями. Одна из сложностей в этой области заключается в том, что доступ к данным может ограничиваться только целевыми выборками, несмотря на то, что существуют связанные нецелевые модели, которые могут повысить точность прогнозирования. Такие ситуации возникают в медицине, финансах и экономике, где недалекость моделей может привести к ошибкам в принятии решений. Это требует развития методов, которые могут эффективно использовать доступные нецелевые данные для повышения точности решений в целевой задаче. ## Метод Этот работа предлагает новую методологию для решения задачи гомосциентной регрессии в рамках подхода трансферного обучения. Основной технический механизм — метод сглаживания бекфитинга с использованием локальной линейной регрессии. Исследователь развивает две вариации этого подхода: одна для объектов с нормальными шумавыми распределениями и другая — для объектов с т HEAVY-TAILED шумавыми распределениями. Метод позволяет учитывать шумы в данных, которые не обязательно имеют нормальное распределение, что делает его универсальным. Более того, в работе представлены новые оценки ошибок и гарантии того, что метод достигает минимаксного оптимального результата при достаточно близких целевой и нецелевой зависимости. ## Результаты Полученные результаты подтверждают эффективность предложенной методологии в сравнении с существующими подходами. Используя симуляционные данные и реальные выборки, автор проверяет работу метода в различных условиях. Особое внимание уделяется ситуациям, когда целевые и нецелевые зависимости отличаются, но по-прежнему могут приносить пользу в обучении. Также доказано, что при достаточно близкости моделей целевой и нецелевой получается минимаксно оптимальный результат. Эти результаты демонстрируют эффективность метода в решении задачи трансферного обучения в высокомерных моделях. ## Значимость Продемонстрированный подход имеет широкое применение в решении задач трансферного обучения в высокомерных моделях. Он позволяет эффективно использовать дополнительные, даже несвязанные, данные для повышения точности прогнозов. Из преимуществ можно отметить универсальность метода в работе с различными типами шумов и высокую точность в условиях близости моделей. Это делает метод полезным в приложениях, где данные не всегда являются полностью надлежащим образом отнесенны к целевой задаче, но могут повлиять на результат. ## В

Annotation:

This paper studies high-dimensional additive regression under the transfer learning framework, where one observes samples from a target population together with auxiliary samples from different but potentially related regression models. We first introduce a target-only estimation procedure based on the smooth backfitting estimator with local linear smoothing. In contrast to previous work, we establish general error bounds under sub-Weibull($\alpha$) noise, thereby accommodating heavy-tailed erro...

ID: 2509.06308v1 stat.ML, cs.LG, math.ST, stat.TH

arXiv PDF

📄 Fast kernel methods: Sobolev, physics-informed, and additive models

2025-09-06

Авторы:

Nathan Doumèche, Francis Bach, Gérard Biau, Claire Boyer

## Контекст Обучение с поддержкой экспертного знания (kernel methods) широко применяется в статистическом обучении за счет их высокой точности и гибкости. Однако их квадратичная сложность в зависимости от размера выборки ограничивает их применение в задачах обработки больших данных. Это ограничение налагает значительные ограничения на использование kernel methods в практических задачах, где данные часто имеют миллионы или даже миллиарды объектов. Целью данной работы является развитие методов, позволяющих решить эту проблему, обеспечивая высокую скорость и эффективность вычислений без потери точности. ## Метод Предлагаемая система основывается на представлении ядер через спектр частот, используя Фурье-трансформацию. Это позволяет перейти от вычислений на пространстве выборки к вычислениям в пространстве частот, где вычисления значительно быстрее. Для того, чтобы ускорить и улучшить точность, вводятся неравномерные вычисления (non-uniform fast Fourier transform, NUFFT), которые позволяют обрабатывать данные не только в центре, но и в периферии выборки. Эта архитектура полностью интегрирует процессоры графического уровня (GPU), чтобы добиться максимальной скорости и эффективности. Метод применяется в трех сценариях: регрессионной модели Шоблева, физико-ориентированной регрессии и модели, состоящие из нескольких компонент. ## Результаты Набор экспериментов показал, что предлагаемые методы обеспечивают очень высокую скорость обработки данных, обрабатывая до десятков миллиардов примеров в минуту. Это достигается без потери точности, так как методы соответствуют минимаксным скоростям сходимости, которые стандартны в теории kernel methods. Эксперименты проводились на различных видах данных, в том числе малых и очень больших выборках, чтобы продемонстрировать гибкость и стабильность методов. ## Значимость Предлагаемые методы могут быть применены в многочисленных областях, где требуется обработка больших данных, включая искусственный интеллект, физические модели, биологию и другие науки. Они обеспечивают высокую скорость и точность, что делает их выглядит более эффективными, чем многие существующие подходы. Благодаря использованию GPU, этот подход значительно увеличивает скорость обработки данных, что может привести к существенным экономиям в ресурсах и времени. ## Выводы Предлагаемая работа развивает новый подход к методам ядерной регрессии, который обеспечивает высокую скорость и эффективность для задач обработки больших данных. Результаты экспериментов подтверждают эффективность метода. Будущие исследования будут сфокуси

Annotation:

Kernel methods are powerful tools in statistical learning, but their cubic complexity in the sample size n limits their use on large-scale datasets. In this work, we introduce a scalable framework for kernel regression with O(n log n) complexity, fully leveraging GPU acceleration. The approach is based on a Fourier representation of kernels combined with non-uniform fast Fourier transforms (NUFFT), enabling exact, fast, and memory-efficient computations. We instantiate our framework in three set...

ID: 2509.02649v1 stat.ML, cs.LG, math.ST, stat.ME, stat.TH

arXiv PDF

📄 Distribution estimation via Flow Matching with Lipschitz guarantees

2025-09-06

Авторы:

Lea Kunkel

## Контекст Flow Matching — алгоритм, основанный на обыкновенных дифференциальных уравнениях, является промышленным подходом в области потоко-ориентированного генерируемого моделирования. Он предлагает простой и гибкий альтернативный вариант для диффузионных моделей, которые ныне являются современной стандартом. Хотя Flow Matching доказал свою эмпирическую эффективность, его теоретическое понимание остается ограниченным. Это связано с чувствительностью теоретических оценок к липшицевому константе векторного поля, который движет уравнениями. В данном исследовании, мы изучаем основные условия, направленные на контроль этой зависимости. На основе этих результатов мы получаем скорость сходимости для расстояния Минимума воды между оцененным и целевым распределениями, которая превосходит предыдущие результаты в высоком измерении. Эта оценка распространяется на некоторые классы неограниченных распределений и не требует логического конкавного характера распределений. ## Метод Мы применяем метод Flow Matching для решения проблемы оценки распределений. Наш алгоритм основывается на преобразовании обыкновенных дифференциальных уравнений, которые могут быть изменены для улучшения точности оценки. Мы обращаем внимание на то, чтобы ограничить липшицевую константу, чтобы улучшить предсказания. Кроме того, мы вводим новые технические решения, которые позволяют уменьшить чувствительность к липшицевому константу. Эта модификация включает в себя регуляризацию и адаптивный контроль векторного поля. Эти изменения позволяют нам существенно повысить стабильность и точность модели, даже при работе с высокоизмерительными данными. ## Результаты Мы проводили эксперименты на широком спектре различных распределений, включая как ограниченные, так и неограниченные. В результате, мы получили высокую точность оценки распределений, особенно в сравнении с другими методами, такими как диффузионные модели. Наши результаты показывают, что Flow Matching не только улучшает точность, но и сокращает необходимое время обучения. Мы также проверили нашу модель на высокоизмерительных данных, где Flow Matching показал значительную выгоду в сравнении с другими подходами. Эти результаты подтверждают силу нашего подхода в области оценки распределений, особенно в сложных сценариях. ## Значимость Flow Matching с липшицевыми гарантиями уникален в своей способности оценивать распределения в высоком измерении и для неограниченных распределений. Он может применяться в различных областях, таких как генерируемый моделирование, анализ данных и машинное обучение. Одним из основных преимуществ является его высокая точность и стабильность, да

Annotation:

Flow Matching, a promising approach in generative modeling, has recently gained popularity. Relying on ordinary differential equations, it offers a simple and flexible alternative to diffusion models, which are currently the state-of-the-art. Despite its empirical success, the mathematical understanding of its statistical power so far is very limited. This is largely due to the sensitivity of theoretical bounds to the Lipschitz constant of the vector field which drives the ODE. In this work, we ...

ID: 2509.02337v1 stat.ML, cs.LG, math.ST, stat.TH, 62E17, 62G07, 68T07

arXiv PDF

Показано 31 - 40 из 46 записей