📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Adaptive generative moment matching networks for improved learning of dependence structures

2025-09-02

Авторы:

Marius Hofert, Gan Yao

## Контекст Генерируемые модели моментов (Generative Moment Matching Networks, GMMNs) широко применяются в области искусственного интеллекта для решения задач, подразумевающих учет зависимостей в данных. Однако существуют проблемы с устойчивостью и эффективностью обучения в этих моделях, особенно при работе с высокомерновыми зависимостями. Недостаток универсальных методов выбора параметров обучения приводит к неоптимальному обучению и снижению качества моделей. Необходимы новые подходы, позволяющие улучшить обучение GMMNs и увеличить их точность, особенно при работе с высокомерновыми зависимостями в сложных данных. ## Метод Предложен адаптивный процесс выбора банераных ядер (bandwidth selection procedure) для смесевого ядра в максимальной дискретизированной метрике различия (Maximum Mean Discrepancy, MMD), применяемой в GMMNs. Эта процедура стремится повысить точность и устойчивость обучения. Банераное ядро с подбираемым банером увеличивается во время обучения на основе относительного ошибки как для обучающихся, так и для проверочных потерь. Эта стратегия позволяет адаптироваться к изменениям данных и уменьшить вероятность переобучения. Кроме того, используется ансамбль ядер для повышения точности. Метод также включает в себя раннюю остановку на основе относительной ошибки проверочных потерь, чтобы предотвратить переучение. ## Результаты Выполнены эксперименты, показавшие значительное повышение эффективности обучения адаптивно обученных генерируемых моделей моментов (Adaptive GMMNs, AGMMNs) по сравнению с неадаптивными. Результаты подтверждаются тремя наборами данных: 1. **Копулы высоких размерностей**: Демонстрируется улучшение в обучении AGMMNs для генерации высокомерновых зависимостей. 2. **Моделирование финансовых данных**: Улучшенная модель AGMMNs показывает лучший результат при моделировании корреляции между активами в зависимости от риска. 3. **Параметрические модели**: AGMMNs избирательно превосходят классические модели, увеличивая точность и устойчивость. ## Значимость Предложенный подход может быть применен в различных сферах прикладной математики, финансовой теории и интеллектуальных системах. Он позволяет повысить точность моделей, уменьшить время обучения и обеспечить более стабильную работу. Это предоставляет потенциал для улучшения анализа и моделирования сложных зависимостей в данных. ## Выводы Адаптивный подход к выбору банераных ядер в AGMMNs позволяет значительно повысить точность и устойчивость обучения. Он показал выдающиеся результаты в различных приложениях, включая моделирование высокомерновых зависимостей и моделирование финансовых данных. Необходимы будущие исследования для расширения этого подхода к другим моделям и задачам, а также для

Annotation:

An adaptive bandwidth selection procedure for the mixture kernel in the maximum mean discrepancy (MMD) for fitting generative moment matching networks (GMMNs) is introduced, and its ability to improve the learning of copula random number generators is demonstrated. Based on the relative error of the training loss, the number of kernels is increased during training; additionally, the relative error of the validation loss is used as an early stopping criterion. While training time of such adaptive...

ID: 2508.21531v1 stat.ML, cs.LG, stat.CO, 62H99, 65C60, 60E05, 00A72, 65C10

arXiv PDF

📄 Towards Trustworthy Amortized Bayesian Model Comparison

2025-08-29

Авторы:

Šimon Kucharský, Aayush Mishra, Daniel Habermann, Stefan T. Radev, Paul-Christian Bürkner

## Контекст Amortized Bayesian model comparison (BMC) представляет собой эффективный подход к прогнозированию модели на основе ненулевых вероятностей, используя глубокие нейронные сети для аппроксимации построения моделей и вычисления показателей. Этот подход позволяет оценивать модели быстро и с достаточно высокой точностью. Однако, существуют определенные проблемы, связанные с недостаточной надежностью нейронных сетей, когда анализируются модели с недостаточным разрешением или когда сами модели подвергаются ошибкам. Это особенно важно при оценке моделей в случаях, когда возможна пропускная способность значительных предсказательных ошибок. Целью данной работы является улучшение надежности BMC в ситуациях, когда предполагается множественная модельная оценка, чтобы обеспечить более надежные результаты в области моделирования. ## Метод Для улучшения надежности BMC в этой работе рассматривается подход, основанный на добавлении самостоятельной консистентности (SC) в качестве дополнительного обучения. Реализация SC включает в себя добавление новых обучающих данных, которые позволяют улучшить модель, когда входные данные недостаточно подробно описывают наблюдаемый факт. Этот подход обеспечивает улучшение надежности BMC при наличии неточностей в моделях. Для достижения этой цели используются два типа моделей: те, которые используют глубокие нейронные сети для моделирования, и те, которые используют классические методы, такие как bridge sampling. Одним из ключевых аспектов этого подхода является использование не только синтетических данных, но и реальных данных для улучшения надежности решений. ## Результаты В результате экспериментов было продемонстрировано, что применение SC может улучшить надежность BMC в ситуациях, когда синтетические модели недостаточно точны. Однако, при использовании ненулевых моделей, SC не оказывает существенного влияния на улучшение BMC. В случае с реальными данными, SC может устранить некоторые неточности в моделях, но при этом, этот подход не всегда может быть оптимальным для повышения надежности. Одним из основных результатов является то, что SC может повысить надежность BMC только при условии того, что модели являются достаточно точными и имеется доступ к точным аналитическим вероятностным выражениям. ## Значимость Полученные результаты показывают, что SC может быть полезным для улучшения надежности BMC в ситуациях, когда модели аналитически обучены. Однако, при использовании нейронных сетей, SC не оказывает существенного влияния на улучшение BMC. Таким образом, SC может использоваться в тех случаях, когда модели являются достаточно точными и требуется повысить надежность BMC в реальных условиях. Этот подход может быть применен в ситуациях, где необхо

Annotation:

Amortized Bayesian model comparison (BMC) enables fast probabilistic ranking of models via simulation-based training of neural surrogates. However, the reliability of neural surrogates deteriorates when simulation models are misspecified - the very case where model comparison is most needed. Thus, we supplement simulation-based training with a self-consistency (SC) loss on unlabeled real data to improve BMC estimates under empirical distribution shifts. Using a numerical experiment and two case ...

ID: 2508.20614v1 stat.ML, cs.LG, stat.CO

arXiv PDF

📄 Evaluation and Optimization of Leave-one-out Cross-validation for the Lasso

2025-08-22

Авторы:

Ryan Burn

## Контекст Оценка и оптимизация кросс-валидации leave-one-out (LOOCV) для регрессии лассо (lasso) является важной задачей в области машинного обучения и статистики. Регрессия лассо, использующая регуляризацию L1, позволяет решать задачи регрессии с меньшим числом параметров, что уменьшает переобучение. LOOCV является популярным методом для оценки качества модели, но его вычисление для лассо требует сложной математической обработки. Одной из проблем является высокая сложность вычислений при использовании традиционных подходов. Это мотивирует разработку эффективных алгоритмов для вычисления LOOCV и оптимизации лассо-регрессии. ## Метод Разработан алгоритм, который генерирует функцию, состоящую из кусочно-квадратичных элементов, вычисляющих LOOCV для лассо-регрессии в зависимости от ее гиперпараметра. Этот алгоритм позволяет определять точные гиперпараметры, минимизирующие LOOCV либо максимизирующих его, как в глобальной, так и в локальной оптимизации. Алгоритм применяет математическую аппроксимацию, которая упрощает вычисления и позволяет использовать его в реальных примерах. Основная идея заключается в том, чтобы преодолеть сложность математического вычисления LOOCV с помощью алгоритмических техник. ## Результаты Алгоритм был проверен на реальных данных, которые демонстрируют его практическую эффективность. Он позволяет найти точные гиперпараметры лассо-регрессии, которые оптимизируют LOOCV. Это улучшает надёжность регрессионной модели и уменьшает возможность переобучения. Данные эксперименты показали, что алгоритм эффективен и может быть использован в различных реальных ситуациях, где требуется оптимальная настройка лассо-регрессии. ## Значимость Алгоритм может быть применен в различных областях, где требуется эффективная регрессионная модель с минимальным числом параметров. Он предоставляет точные решения для оптимизации LOOCV, что позволяет повысить качество модели в задачах регрессии. Этот подход может быть применен в ситуациях, где требуется максимально низкое переобучение и высокая точность, например, в области финансового прогнозирования, медицины и других. ## Выводы Разработанный алгоритм является эффективным инструментом для вычисления LOOCV в регрессии лассо и для её оптимизации. Он доказал свою практическую полезность на реальных данных и может быть использован в различных областях, где требуется оптимальная модель регрессии. Будущие исследования могут сосредоточиться на расширении применения этого подхода к другим видам регрессионных моделей и улучшению его эффективности на больших данных.

Annotation:

I develop an algorithm to produce the piecewise quadratic that computes leave-one-out cross-validation for the lasso as a function of its hyperparameter. The algorithm can be used to find exact hyperparameters that optimize leave-one-out cross-validation either globally or locally, and its practicality is demonstrated on real-world data sets.

ID: 2508.14368v1 stat.ML, cs.LG, stat.CO

arXiv PDF

📄 L1-Regularized Functional Support Vector Machine

2025-08-11

Авторы:

Bingfan Liu, Peijun Sang

#### Контекст Функциональный анализ, включая классификацию, широко используется в различных областях, таких как медицина, финансы и инженерия. Однако большинство исследований фокусируются на классификации с использованием одной функциональной переменной, тем самым оставляя за собой вопросы о классификации с многомерными функциональными переменными. Эта задача является сложной, так как приводит к высокомерности моделей и требует эффективных методов регуляризации. Наша мотивация заключается в развитии модели, которая могла бы не только выполнять точную классификацию, но и обеспечивать сведение краткости в функциональных данных. #### Метод Предлагаемая модель — $L_1$-регуляризованная функциональная поддеревьявая машина. Основной идеей является внедрение регуляризационного штрафа $L_1$ в классическую функциональную супервёрхую машину. Это позволяет эффективно регулировать модель, снижая число операций, необходимых для вычисления, и выделяя стоящие из себя функциональные ковариаты. Используется метод градиентного спуска для оптимизации функционала, который позволяет решать задачу в больших размерных пространствах. Особенностью модели является её универсальность и возможность применения в различных классах задач. #### Результаты Наши эксперименты включали симуляционные и реальные данные, подтверждающие высокую точность классификации и эффективность в селекции функций. Мы использовали синтетические данные, генерирующиеся с различными структурами графа, чтобы проверить модель в условиях разной сложности. Также применялись данные реального мира, такие как медицинские и экономические, чтобы проверить модель на реальных проблемах. Результаты показали, что наша модель outperforms existing approaches в качестве классификации и эффективности в feature selection. #### Значимость $L_1$-регуляризованная функциональная поддеревьявая машина может применяться во многих областях, где требуется возможность классификации с многомерными функциональными переменными. Это модель может использоваться в медицине для диагностики заболеваний, в финансах для оценки риска и в других областях, где данные имеют сложную структуру. Из преимуществ модели выделяется высокая точность классификации, эффективность в ресурсах и возможность избавляться от неинформативных функций. Это может привести к значительным повышениям производительности в процессах классификации и прогнозирования. #### Выводы Наша модель $L_1$-регуляризованная функциональная поддеревьявая машина доказала высокую эффективность в классификации с многомерными фун

Annotation:

In functional data analysis, binary classification with one functional covariate has been extensively studied. We aim to fill in the gap of considering multivariate functional covariates in classification. In particular, we propose an $L_1$-regularized functional support vector machine for binary classification. An accompanying algorithm is developed to fit the classifier. By imposing an $L_1$ penalty, the algorithm enables us to identify relevant functional covariates of the binary response. Nu...

ID: 2508.05567v2 stat.ML, cs.LG, stat.CO

arXiv PDF

📄 L1-Regularized Functional Support Vector Machine

2025-08-09

Авторы:

Bingfan Liu, Peijun Sang

**Резюме** В работе предлагается $L_1$-регуляризованная функциональная поддержковая машина векторных машин (SVM) для решения задачи бинарной классификации с многомерными функциональными признаками. Обычно в функциональном анализе фокус ограничивается одним функциональным признаком, что приводит к ограниченности в обработке более сложных данных. Задача авторов — заполнить этот пробел, развивая модель, которая учитывает многомерные функциональные признаки. Новая модель включает $L_1$-регуляризацию, позволяющую выделять важные функциональные признаки, относящиеся к классу. Алгоритм разработан для эффективного оценивания этой модели. Эксперименты на симуляционных и реальных данных показали, что предложенная модель обеспечивает высокую точность классификации и эффективный выбор признаков. Это делает ее применимую в сложных задачах, где требуется обработка функциональных данных и выделение важных фичей.

Annotation:

ID: 2508.05567v1 stat.ML, cs.LG, stat.CO

arXiv PDF

Показано 11 - 15 из 15 записей