📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня
Авторы:

Yanfeng Yang, Siwei Chen, Pingping Hu, Zhaotong Shen, Yingjie Zhang, Zhuoran Sun, Shuai Li, Ziqi Chen, Kenji Fukumizu

## Контекст Многомерное прогнозирование временных рядов представляет собой сложную задачу из-за нестационарности данных, зависимостей между переменными и динамически изменяющихся распределений. Несмотря на то, что недавние модели на основе технологий диффузии и матчинга потоков показали свою эффективность, они часто не учитывают информативных предварительных знаний, таких как условные средние и ковариации. Эти факторы ограничивают точность прогнозирования и повышение устойчивости моделей. Мотивируя нашу работу, мы призваны развить более устойчивые и точные методы, которые могут обрабатывать данные временных рядов с учетом условных предварительных информаций. ## Метод Мы предлагаем Conditionally Whitened Generative Models (CW-Gen), новую архитектуру, которая интегрирует информативные предварительные сведения с помощью условной дезинвариации (conditional whitening). Теоретически, мы установили условия, при которых замена традиционного терминального распределения в моделях диффузии на многомерное нормальное распределение, определяемое условным средним и ковариацией, улучшает качество прогнозов. На основе этой теории мы разработали новый Joint Mean-Covariance Estimator (JMCE), который работает с условным средним и скользящими окнами для ковариации. Мы также предложили Conditionally Whitened Diffusion Models (CW-Diff) и расширили их для Conditionally Whitened Flow Matching (CW-Flow). Эти модели работают с условием, чтобы учитывать статистические зависимости и корреляции между переменными. ## Результаты Мы провели эксперименты на пяти реальных датасетах, сравнив нашу модель с шестью состоящими стейт-оф-арт моделями в области прогнозирования временных рядов. Результаты показали, что CW-Gen повышает точность прогнозирования, более эффективно учитывая динамические изменения и зависимости между переменными, чем существующие модели. Мы также проверили, насколько модель устойчива к сдвигам распределения, и установили, что она позволяет снизить эффект дискрепанции прогнозов. Эти эксперименты указывают на то, что условная дезинвариация значительно повышает качество прогноза по сравнению с принципиально безусловными моделями. ## Значимость Наша модель может применяться в многочисленных сферах, таких как финансовый анализ, техническая аналитика, информационные системы и прогнозирование погоды. Она предоставляет значительные преимущества, такие как улучшенная точность прогнозов, устойчивость к динамическим изменениям и обработка зависимостей между переменными. Эти достижения могут повысить уровень достоверности во многих высокотехнологичных приложениях, что демонстрирует значительный потенциал CW-Gen в области прогнозирования временных рядов. ## Выводы Прове
Annotation:
Probabilistic forecasting of multivariate time series is challenging due to non-stationarity, inter-variable dependencies, and distribution shifts. While recent diffusion and flow matching models have shown promise, they often ignore informative priors such as conditional means and covariances. In this work, we propose Conditionally Whitened Generative Models (CW-Gen), a framework that incorporates prior information through conditional whitening. Theoretically, we establish sufficient conditions...
ID: 2509.20928v1 stat.ML, cs.LG
Авторы:

Vahe Karagulyan, Pierre Alquier

## Контекст Общая теория обобщаемости была сконцентрирована на независимых наблюдениях. Однако, в некоторых работах рассматриваются модели с временными зависимостями. Например, были разработаны PAC и PAC-Bayes бунды для таких случаев. Однако, эти бунды содержат константы, зависящие от свойств порождающего процесса, таких как миксинг-коэффициенты, миксинг-время, и спектральный лаг. Такие константы обычно неизвестны в практических задачах. Настоящая работа посвящена разработке нового PAC-Bayes бунда для Марковских цепей, который зависит от нового понятия - псевдо-спектрального лага. Наша главная новизна заключается в том, что мы можем вычислить эмпирическую оценку этого псевдо-спектрального лага в случае конечного состояния. Таким образом, мы получили первый полностью эмпирический PAC-Bayes бунд для Марковских цепей. Это расширение валидно не только для конечных пространств состояний, однако требуются дополнительные предположения. На эмпирических экспериментах, эмпирическая версия бунда оказалась почти такой же строгой, как и неэмпирическая. ## Метод Мы разработали новую теорему о PAC-Bayes бунде для Марковских цепей. Эта теорема основывается на новом понятии - псевдо-спектрального лага. Чтобы получить эмпирическую оценку этого псевдо-спектрального лага, мы использовали моделирование на конечных пространствах состояний. Для эмпирического приближения, мы использовали теорию Марковских цепей, обобщенную на временные зависимости. Эта модель позволяет получить бунд, который зависит от псевдо-спектрального лага, но не требует предварительного знания свойств порождающего процесса. Мы также разработали симуляционные эксперименты, позволяющие проверить точность полученного бунда. ## Результаты Мы провели эксперименты на симуляционных данных с конечным пространством состояний. Наши результаты показали, что эмпирический PAC-Bayes бунд оказался почти такой же строгим, как и неэмпирический. Это задает новый подход к оценке обобщаемости для Марковских цепей, когда нет доступа к константам, зависящим от свойств процесса. Были получены результаты, подтверждающие эффективность псевдо-спектрального лага в качестве меры зависимости в Марковских цепях. Эти результаты могут быть применены в машинном обучении и других областях, где используются временные зависимости. ## Значимость Наша работа имеет значительное значение для области обобщаемости в нейронных сетях и вычислительной теории. Наш бунд может быть применен в задачах, где тре
Annotation:
The core of generalization theory was developed for independent observations. Some PAC and PAC-Bayes bounds are available for data that exhibit a temporal dependence. However, there are constants in these bounds that depend on properties of the data-generating process: mixing coefficients, mixing time, spectral gap... Such constants are unknown in practice. In this paper, we prove a new PAC-Bayes bound for Markov chains. This bound depends on a quantity called the pseudo-spectral gap. The main n...
ID: 2509.20985v1 stat.ML, cs.LG
Авторы:

Soham Bonnerjee, Sayar Karmakar, Subhrajyoty Roy

## Контекст Современные технологии позволяют генерировать текст с помощью глубоких нейронных сетей, превратив это в повседневный инструмент. Однако это привело к повышению вопросов о подлинности генерируемого контента. Watermarking стало популярным методом для доказательства владения текстом или его происхождения. Однако определение, какие фрагменты текста являются watermarked, является сложным заданием, особенно когда текст перепишен или модифицирован. Нарастающий интерес к этой задаче побудил авторов разработать новый подход к watermark segmentation с использованием эпидемических change-points. ## Метод Предложенный подход, WISER (Watermark Segmentation via Epidemic Change-points), основывается на методах эпидемических change-points, которые были доминировали в статистической обработке данных. WISER рассматривает watermarking как вирусное распространение информации в тексте. Алгоритм использует функции, которые позволяют находить точки, где появляются водяные знаки, а также определять, какие части текста являются watermarked. Алгоритм имеет высокую эффективность и теоретически доказанную точность. ## Результаты Авторы проверили WISER на нескольких benchmark-датасетах, включающих различные варианты водяных знаков. Алгоритм показал высокую точность в локализации watermarked сегментов и опередил существующие методы в скорости и точности. Эксперименты подтвердили, что WISER может эффективно обрабатывать тексты с разными водяными знаками и парафразированным контентом. ## Значимость WISER может использоваться в различных сферах, где требуется установить подлинность или владение текстом, таких как защита авторских прав, борьба с нежелательным контентом или проверка нейрогенерируемого текста. Он предлагает выгоды в скорости выполнения и точности сравнения с остальными методами. Этот подход может стать важной частью технологий, применяемых в компьютерных зрении, естественном языковом обработке и дальнейшем развитии машинного обучения. ## Выводы Авторы успешно показали, что WISER является эффективным инструментом для watermark segmentation. Он основывается на теоретической легитимности и вы most-setting. В будущем, WISER может быть развит для обработки более сложных случаев watermarking, включая нейрогенерируемый текст с сильными модификациями.
Annotation:
With the increasing popularity of large language models, concerns over content authenticity have led to the development of myriad watermarking schemes. These schemes can be used to detect a machine-generated text via an appropriate key, while being imperceptible to readers with no such keys. The corresponding detection mechanisms usually take the form of statistical hypothesis testing for the existence of watermarks, spurring extensive research in this direction. However, the finer-grained probl...
ID: 2509.21160v1 stat.ML, cs.LG, stat.ME
Авторы:

Alexis Ayme, Bruno Loureiro

#### Контекст Обработка данных с высокой размерностью широко применяется в машинном обучении, статистике и принятии решений. Однако с ростом размерности данных возрастает риск ухудшения качества моделей, что известно как "курсая диаметральности" (curse of dimensionality). Эта проблема становится актуальной при использовании линейных правил в статистическом обучении, таких как регрессия Риджа, десцента градиентов и методы ядерного анализа. Необходимо изучить, какие ограничения на структуру данных позволяют избежать ухудшения обобщающих свойств моделей при увеличении размерности. #### Метод Авторы изучают класс линейных предсказателей, expessed как суммы линейных комбинаций меток обучающих примеров: $f(X) = \sum_{i=1}^{n} l_{i}(X) Y_i$. Основной методологией является анализ необходимых условий для эффективности таких предсказателей, определенных через априорную значимость вектора $\theta$ в эллипсоидной области. Используются методы теории вероятности и теории хаоса для оценки обобщающей способности моделей. #### Результаты Получены точные оценки для обобщающей способности линейных предсказателей: 1. Неасимптотические доверительные интервалы для обобщающей ошибки. 2. Точная оценка для подкласса линейных предсказателей с вращательной инвариантностью. 3. Однозначное влияние геометрии объектов на обобщающую способность, в частности, разрешается зависимость между риском и внутренней размерностью данных. #### Значимость Результаты имеют первоклассное значение для машинного обучения, статистики и принятия решений. Например, в задачах классификации, регрессии и детектирования зависимостей модели становятся более надежными в высокомерностных задачах благодаря полученным оценкам. Данные результаты также доступны для улучшения существующих моделей, например, классификаторов и линейных предсказателей в области технологий и анализа больших данных. #### Выводы Авторы установили, что условия вроде структуры данных и геометрии объектов могут значительно снизить риск ухудшения обобщающих свойств моделей при увеличении размерности. Эти находки могут стать основой для развития новых методов в области машинного обучения. Будущие исследования должны фокусироваться на расширении моделей и применении этих положений к реальным задачам.
Annotation:
In this work, we address the following question: What minimal structural assumptions are needed to prevent the degradation of statistical learning bounds with increasing dimensionality? We investigate this question in the classical statistical setting of signal estimation from $n$ independent linear observations $Y_i = X_i^{\top}\theta + \epsilon_i$. Our focus is on the generalization properties of a broad family of predictors that can be expressed as linear combinations of the training labels, ...
ID: 2509.21174v1 stat.ML, cs.LG
Авторы:

Andrew Gordon Wilson, Zhiting Hu, Ruslan Salakhutdinov, Eric P. Xing

## Контекст Область исследований, призванная расширить возможности глубокого обучения с использованием ядерных методов, сталкивается с рядом проблем и вопросов. Одна из таких проблем заключается в необходимости найти баланс между данными и комплексностью модели. Многие модели стремятся максимизировать достоверность данных, однако это может привести к переобучению и неэффективности. За последние годы были предложены различные алгоритмы, которые пытались улучшить этот баланс, но все же существуют спорные моменты в их работе. Исследователи также сталкиваются с проблемами связанными с выбором ядер и их гиперпараметров, что влияет на качество решений задач. Мотивация для данного исследования заключается в разведении некоторых спорных моментов, методических неточностей и раскрытии потенциала новых подходов, таких как Deep Kernel Learning (DKL). ## Метод Методом DKL является расширение гладких гауссовских процессов (GP), которое позволяет использовать нелинейные ядра в стохастических моделях. Главным элементом данного подхода является использование критерия Байеса для оптимизации гиперпараметров модели. Основной идеей является то, что модель может построить более точные предсказания, если будут учтены как данные, так и комплексность априорных знаний. Для этого используется параметрическое представление ядер, которое позволяет их параметризовать и оптимизировать. Данный подход также использует глубокие нейронные сети для предсказания модели, что позволяет увеличить точность и обучаемость. Для решения задач используются методы градиентного спуска, которые оптимизируют логарифмический правдоподобие. ## Результаты Исследования показали, что DKL может эффективно решать задачи классификации и регрессии, показывая высокую точность и надежную обучаемость. Для эффективности использования подхода были проведены эксперименты на различных датасетах, в том числе на MNIST и CIFAR-10. Результаты показали, что DKL превосходит многие другие методы, в том числе гауссовские процессы и традиционные нейронные сети. Особенно выдачливым оказался DKL в задачах, требующих учета нелинейных зависимостей в данных. Также был проведен эксперимент с использованием реальных данных, на котором DKL показал себя лучше, чем модели с традиционными ядрами. ## Значимость Подход DKL может быть применен в различных областях, включая машинное обучение, анализ данных, технические приложения и даже в области биоинформатики. Одним из основных преимуществ является увеличение точности и уменьшение времени обучения модели. Благодаря использованию глубоких нейронных сетей, DKL мож
Annotation:
This note responds to "Promises and Pitfalls of Deep Kernel Learning" (Ober et al., 2021). The marginal likelihood of a Gaussian process can be compartmentalized into a data fit term and a complexity penalty. Ober et al. (2021) shows that if a kernel can be multiplied by a signal variance coefficient, then reparametrizing and substituting in the maximized value of this parameter sets a reparametrized data fit term to a fixed value. They use this finding to argue that the complexity penalty, a lo...
ID: 2509.21228v1 stat.ML, cs.LG
Авторы:

Dominic Broadbent, Nick Whiteley, Robert Allison, Tom Lovett

#### Контекст Современные задачи анализа данных часто связаны с большими объемами данных, которые требуют эффективных методов для сжатия и упрощения. Одной из ключевых проблем является сохранение точности и структуры исходной информации при сжатии. Наиболее распространенные методы сжатия ориентированы на минимизацию расстояния между исходными и сжатыми данными в одной области. Однако некоторые данные характеризуются высокой мерностью и большим размером выборки, что способствует появлению ряда технических и вычислительных сложностей. Это задание направлено на разработку методики, максимально эффективно сжимающей данные как по объему, так и по размерности, сохраняя их оригинальные свойства. #### Метод Метод, предложенный в статье, называется Bilateral Distribution Compression (BDC). Это двухстадийная архитектура, которая адресует проблему сжатия как по размерности, так и по объему. В первой стадии используется Reconstruction MMD (RMMD) для выявления низкоразмерной проекции, оптимизированной с целью сохранения информации о данных. Во второй стадии эта проекция используется для оптимизации Encoded MMD (EMMD), чтобы сжатый набор данных гарантированно отражал исходное распределение. Решение основывается на Decoded MMD (DMMD), который измеряет расстояние между исходными данными и сжатыми проекциями. Это разработанный подход позволяет сократить объем и размерность данных с минимальным ущербным влиянием на их структуру и характеристики. #### Результаты Исследования проводились на различных типах данных, включая синтетические и реальные многомерные выборки. Результаты показали, что BDC достигает поразительного сжатия данных с сохранением высокой точности. Он сравнился с существующими методами сжатия, в том числе Ambient-space Compression, и показал сильное преимущество в скорости и эффективности. Эксперименты подтвердили, что BDC достигает похожих или лучших результатов с меньшим вычислительным и памятным влиянием. #### Значимость BDC может применяться в различных областях, где требуется эффективное сжатие данных, например, в машинном обучении, статистике и анализе больших данных. Преимущества BDC заключаются в своей гибкости, удобстве реализации и высокой эффективности. Он позволяет значительно сократить затраты на обработку и хранение данных без потери информационной работоспособности. Это может привести к улучшению производительности на уровне систем, повышению экономичности в предметных областях и ускорению задач обработки данных. #### Выводы Разработанный подход BDC доказал свою эффективность в сжатии данных с сохранением их свойств. Он готов к применению в различ
Annotation:
Existing distribution compression methods reduce dataset size by minimising the Maximum Mean Discrepancy (MMD) between original and compressed sets, but modern datasets are often large in both sample size and dimensionality. We propose Bilateral Distribution Compression (BDC), a two-stage framework that compresses along both axes while preserving the underlying distribution, with overall linear time and memory complexity in dataset size and dimension. Central to BDC is the Decoded MMD (DMMD), wh...
ID: 2509.17543v3 stat.ML, cs.LG, stat.ME
Авторы:

Mert Gurbuzbalaban, Hoang M. Nguyen, Xicheng Zhang, Lingjiong Zhu

## Контекст Одним из основных задач в машинном обучении является эффективное семплирование из распределений, представляющих собой модели для обработки данных. Одним из популярных подходов является использование методов типа Langevin dynamics, которые позволяют эффективно решать задачи семплирования в высоком размерности. Однако, существуют ограничения. Они не могут семплировать данные, имеющие недифференцируемые компоненты в лог-плотности, что исключает многие прикладные задачи. Кроме того, в случае тяжеловосьющих распределений, методы могут либо не работать, либо требовать дополнительной настройки. Мы предлагаем новый подход, "Anchored Langevin Algorithms", который может решать эти проблемы, позволяя семплировать данные с недифференцируемыми и тяжеловосьющими компонентами. ## Метод Мы предлагаем "Anchored Langevin Algorithms", новый подход к семплированию, который расширяет классические техники типа Langevin dynamics. Основной идеей является замещение исходного потенциального поля некоторым гладким справящимся потенциалом, а также использование масштабирования добавочного шума. Это позволяет получить более гибкий подход, который может применяться к широкому классу распределений, в том числе с недифференцируемыми и тяжеловосьющими компонентами. Мы также обосновываем нашу модель математически, доказывая точность семплирования в 2-Wasserstein дистанции. ## Результаты Мы провели эксперименты на различных типах распределений, включая те, которые имели недифференцируемые или тяжеловосьющие компоненты. Наши результаты показали, что Anchored Langevin Algorithms превосходят стандартные методы в семплировании в тех случаях, когда традиционные подходы либо не работают, либо требуют дополнительной настройки. Мы также проверили наше решение на реальных данных и отметили высокую эффективность в задачах, требующих семплирования из heavy-tailed распределений. ## Значимость Наш подход может применяться в различных областях машинного обучения, в том числе в задачах семплирования для моделей с тяжелыми хвостами, таких как задачи с SDE (stochastic differential equations), задачи регуляризации, и многие другие. Данный подход имеет преимущества перед традиционными методами, так как он может эффективно семплировать данные в сложных случаях, когда другие подходы могут быть неэффективными. Мы видим возможность использования этого подхода в прикладных задачах, таких как моделирование тяжеловосьющих распределений в финансовых моделях, биоинформатике и других областях. ## Выводы Мы предлагаем новый метод для семплирования, который может работать в сложных случаях с недифференцируемыми или тяже
Annotation:
Standard first-order Langevin algorithms such as the unadjusted Langevin algorithm (ULA) are obtained by discretizing the Langevin diffusion and are widely used for sampling in machine learning because they scale to high dimensions and large datasets. However, they face two key limitations: (i) they require differentiable log-densities, excluding targets with non-differentiable components; and (ii) they generally fail to sample heavy-tailed targets. We propose anchored Langevin dynamics, a unifi...
ID: 2509.19455v1 stat.ML, cs.LG, math.PR
Авторы:

Li Zhou, Elvan Ceyhan

#### Контекст Планирование путей в помехах является ключевым проблемой в автоматизации, искусственном интеллекте и робототехнике. Особенно сложной является задача навигации в помещениях с неоднородными, скоррелированными препятствиями и нестабильными сенсорными данными. Избирательное использование сенсора для получения дополнительных сведений о труднодоступных областях помогает снизить неопределенность, но накладывает дополнительные затраты на время и ресурсы. Исследование задач планирования путей в помещениях с коррелированными препятствиями проводится для улучшения решений в условиях нестабильности и неопределенности. #### Метод Мы предлагаем модель **Stochastic Correlated Obstacle Scene (SCOS)**, основанную на **Gaussian Random Field (GRF)** для представления корреляции препятствий. Сенсоры собирают неточные данные о блокировках, а алгоритмы Bayesian belief update используются для уточнения блокировочных вероятностей. Для нахождения оптимального пути вводится двухэтапный фреймворк: в первой стадии происходит оптимизация политики с использованием **Optimistic Policy Iteration** и **Information Bonus** для поиска наиболее информативных регионов. Во второй стадии применяется онлайн-политика с регулярными обновлениями базовой политики на основе механизма Байеса, адаптирующегося к новым данным. Метод поддерживает распределенное обучение полными распределениями затрат, что улучшает квантование неопределенности. #### Результаты Наши эксперименты проводились на различных симулированных маппах с разным разрешением и плотностью препятствий. Мы сравнивали нашу модель со стандартными методами, такими как Value Iteration, Monte Carlo Tree Search и Distributional RL. Модель SCOS показала значительное сокращение потребленных ресурсов при одновременном повышении точности и скорости нахождения пути. Для оценки адаптивности использовались сценарии с адверсариальными препятствиями и случайными помехами. Результаты показали, что наш алгоритм превосходит базовые методы в области эффективности и надежности. #### Значимость Наша модель может быть применена в различных сферах, включая навигацию роботов в закрытых помещениях, планирование в условиях сбоев сети, а также в задачах мониторинга и очистки природных хаотических объектов. Отличительным преимуществом является возможность учета корреляции препятствий, что позволяет повысить точность и эффективность планирования. Развитие данной модели может привести к улучшению безопасности и эффективности в системах автоматического управления. #### Выводы Мы представили модель SCOS для планирования путей в помещениях с коррелированными препятствиями и нестабильными сенсорными данными. Наша модель использует Байесовские обновления вероятностей и двухэ
Annotation:
We introduce the Stochastic Correlated Obstacle Scene (SCOS) problem, a navigation setting with spatially correlated obstacles of uncertain blockage status, realistically constrained sensors that provide noisy readings and costly disambiguation. Modeling the spatial correlation with Gaussian Random Field (GRF), we develop Bayesian belief updates that refine blockage probabilities, and use the posteriors to reduce search space for efficiency. To find the optimal traversal policy, we propose a nov...
ID: 2509.19559v1 stat.ML, cs.LG, stat.CO
Авторы:

Dohyun Ku, Catherine D. Chong, Visar Berisha, Todd J. Schwedt, Jing Li

## Контекст Исследования в области анализа значков временных рядов в здравоохранении целевая область, направленная на точные диагностические и прогностические выводы. Одним из ключевых проблем, с которыми сталкиваются аналитики, является "метки времени" (time misalignment) и "нехватка данных" (data sparsity). Эти проблемы становятся проблемами, когда данные отсутствуют или непоследовательны во времени. Традиционные подходы обычно разделяют проблему на два этапа: импутация и прогноз. Однако это приводит к увеличению времени обработки и потерям информации. Мы предлагаем новый подход, который удачно объединяет оба этапа в одном фреймворке, чтобы увеличить точность и эффективность. ## Метод Мы предлагаем MAGIC (Multi-tAsk Gaussian Process for Imputation and Classification), новый фреймворк, который решает две задачи одновременно: импутацию пропущенных данных и классификацию. Этот подход основан на многозадачном гауссовском процессе, который может учитывать информацию о классе и выполнять классификацию внутри этого процесса. Основными инновациями являются: 1) трансформация задачи импутации в классификационную задачу с использованием логистической регрессии, 2) использование гауссовского процесса для решения проблемы малого размера выборки, 3) использование теории приближений Тейлора для решения задачи неинтрактуабельности функционального логарифмического правдоподобия. ## Результаты Мы проверили эффективность MAGIC на двух симулированных задачах: 1) прогноз пост-травматической головной боли после травмы мозга, 2) прогноз смерти в течение 48 часов после приема в ИКБ. Наши результаты показывают, что MAGIC превосходит существующие методы по метрикам точности и эффективности. В обоих случаях MAGIC удалось достичь более точных прогнозов даже при небольших объёмах данных, что демонстрирует его практическую применимость в реальном времени. ## Значимость MAGIC показал свою значимость в области здравоохранения, где необходимо выполнять точные диагностические задачи в условиях необходимости быстрого решения. Этот подход может быть использован для многих задач, таких как прогноз прогресса заболевания, оценка риска, оптимизация ресурсов в здравоохранении. Особым преимуществом MAGIC является его универсальность и точность даже при недостатке данных, что сделает его важной инструментой для клинического применения. ## Выводы MAGIC представляет собой перспективный подход к решению проблем импутации и классификации временных рядов в здравоохранении. Мы нашли, что он превосходит существующие методы в тех же условиях. Будущие исследования будут на
Annotation:
Time series analysis has emerged as an important tool for improving patient diagnosis and management in healthcare applications. However, these applications commonly face two critical challenges: time misalignment and data sparsity. Traditional approaches address these issues through a two-step process of imputation followed by prediction. We propose MAGIC (Multi-tAsk Gaussian Process for Imputation and Classification), a novel unified framework that simultaneously performs class-informed missin...
ID: 2509.19577v1 stat.ML, cs.LG
Авторы:

David Huk, Theodoros Damoulas

## Контекст Область исследования сосредоточена на моделировании многомерных зависимостей в данных с помощью copulas. Эти модели широко применяются в различных областях, включая финансы, биологию и компьютерное зрение. Однако существующие модели страдают от ограниченности аппарата и сложности масштабирования для высокомерных и многомодальных данных. Эти проблемы возникают из-за рестриктивных предположений, которые не подходят для решения задач, требующих точного понимания зависимостей в сложных наборах данных. Мотивация для данного исследования заключается в развитии более гибких и эффективных моделей copulas, которые могут справляться с вызовами современных задач. ## Метод Предлагаемые методы основываются на принципах диффузии и потоков, которые допускают управляемое забывание зависимостей между переменными. Две основные процедуры — ForgetCopula и SampleCopula — демонстрируют, как зависимости между переменными могут быть постепенно забыты, оставив распределения по отдельным переменным неизменными. Эти процессы гарантируют, что результирующие модели остаются валидными copulas. Для восстановления забытых зависимостей используется метод обучения, который позволяет модели оптимально восстановить исходные copulas. Две основные реализации различаются по фокусу: первая — на прямом данности, а вторая — на эффективном сэмплировании. ## Результаты Эксперименты проводились на наборах данных, включающих сложные и высокомерные зависимости, такие как симуляции из научных областей и изображения. Наше решение показало значительное превосходство над существующими копулярными моделями в терминах точности моделирования зависимостей и эффективности работы. Мы демонстрируем, что наша модель способна справляться с задачами, в которых простые copulas или другие модели столкнулись с трудностями. Эмпирические результаты подтверждают высокую точность и масштабируемость наших методов в моделировании сложных зависимостей. ## Значимость Промышленные приложения, включая финансовый мониторинг, биологический анализ и компьютерное зрение, могут выгодно использовать нашу модель для обработки многомерных и нетривиальных зависимостей. Наша модель предлагает выигрыш в точности и масштабируемости, открывая новые возможности для применения copulas в задачах, где ранее они не были применимы. Это демонстрирует возможность использования нашего подхода для решения задач с высокой сложностью, которые требуют точных моделей зависимостей. ## Выводы Мы представили методы Diffusion and Flow-based Copulas, которые представляют собой первый подход к моделированию copulas, основанный на забывании и восстановлении зависимостей. Наши результаты показали превосходство
Annotation:
Copulas are a fundamental tool for modelling multivariate dependencies in data, forming the method of choice in diverse fields and applications. However, the adoption of existing models for multimodal and high-dimensional dependencies is hindered by restrictive assumptions and poor scaling. In this work, we present methods for modelling copulas based on the principles of diffusions and flows. We design two processes that progressively forget inter-variable dependencies while leaving dimension-wi...
ID: 2509.19707v1 stat.ML, cs.LG, stat.CO, stat.ME
Показано 371 - 380 из 564 записей