Adaptive generative moment matching networks for improved learning of dependence structures

2508.21531v1 stat.ML, cs.LG, stat.CO, 62H99, 65C60, 60E05, 00A72, 65C10 2025-09-02
Авторы:

Marius Hofert, Gan Yao

Резюме на русском

## Контекст Генерируемые модели моментов (Generative Moment Matching Networks, GMMNs) широко применяются в области искусственного интеллекта для решения задач, подразумевающих учет зависимостей в данных. Однако существуют проблемы с устойчивостью и эффективностью обучения в этих моделях, особенно при работе с высокомерновыми зависимостями. Недостаток универсальных методов выбора параметров обучения приводит к неоптимальному обучению и снижению качества моделей. Необходимы новые подходы, позволяющие улучшить обучение GMMNs и увеличить их точность, особенно при работе с высокомерновыми зависимостями в сложных данных. ## Метод Предложен адаптивный процесс выбора банераных ядер (bandwidth selection procedure) для смесевого ядра в максимальной дискретизированной метрике различия (Maximum Mean Discrepancy, MMD), применяемой в GMMNs. Эта процедура стремится повысить точность и устойчивость обучения. Банераное ядро с подбираемым банером увеличивается во время обучения на основе относительного ошибки как для обучающихся, так и для проверочных потерь. Эта стратегия позволяет адаптироваться к изменениям данных и уменьшить вероятность переобучения. Кроме того, используется ансамбль ядер для повышения точности. Метод также включает в себя раннюю остановку на основе относительной ошибки проверочных потерь, чтобы предотвратить переучение. ## Результаты Выполнены эксперименты, показавшие значительное повышение эффективности обучения адаптивно обученных генерируемых моделей моментов (Adaptive GMMNs, AGMMNs) по сравнению с неадаптивными. Результаты подтверждаются тремя наборами данных: 1. **Копулы высоких размерностей**: Демонстрируется улучшение в обучении AGMMNs для генерации высокомерновых зависимостей. 2. **Моделирование финансовых данных**: Улучшенная модель AGMMNs показывает лучший результат при моделировании корреляции между активами в зависимости от риска. 3. **Параметрические модели**: AGMMNs избирательно превосходят классические модели, увеличивая точность и устойчивость. ## Значимость Предложенный подход может быть применен в различных сферах прикладной математики, финансовой теории и интеллектуальных системах. Он позволяет повысить точность моделей, уменьшить время обучения и обеспечить более стабильную работу. Это предоставляет потенциал для улучшения анализа и моделирования сложных зависимостей в данных. ## Выводы Адаптивный подход к выбору банераных ядер в AGMMNs позволяет значительно повысить точность и устойчивость обучения. Он показал выдающиеся результаты в различных приложениях, включая моделирование высокомерновых зависимостей и моделирование финансовых данных. Необходимы будущие исследования для расширения этого подхода к другим моделям и задачам, а также для

Abstract

An adaptive bandwidth selection procedure for the mixture kernel in the maximum mean discrepancy (MMD) for fitting generative moment matching networks (GMMNs) is introduced, and its ability to improve the learning of copula random number generators is demonstrated. Based on the relative error of the training loss, the number of kernels is increased during training; additionally, the relative error of the validation loss is used as an early stopping criterion. While training time of such adaptively trained GMMNs (AGMMNs) is similar to that of GMMNs, training performance is increased significantly in comparison to GMMNs, which is assessed and shown based on validation MMD trajectories, samples and validation MMD values. Superiority of AGMMNs over GMMNs, as well as typical parametric copula models, is demonstrated in terms of three applications. First, convergence rates of quasi-random versus pseudo-random samples from high-dimensional copulas are investigated for three functionals of interest and in dimensions as large as 100 for the first time. Second, replicated validation MMDs, as well as Monte Carlo and quasi-Monte Carlo applications based on the expected payoff of a basked call option and the risk measure expected shortfall as functionals are used to demonstrate the improved training of AGMMNs over GMMNs for a copula model fitted to the standardized residuals of the 50 constituents of the S&P 500 index after deGARCHing. Last, both the latter dataset and 50 constituents of the FTSE~100 are used to demonstrate that the improved training of AGMMNs over GMMNs and in comparison to the fitting of classical parametric copula models indeed also translates to an improved model prediction.

Ссылки и действия