Structured Kernel Regression VAE: A Computationally Efficient Surrogate for GP-VAEs in ICA

2508.09721v1 stat.ML, cs.LG 2025-08-15

Авторы:

Yuan-Hao Wei, Fu-Hao Deng, Lin-Yong Cui, Yan-Jie Sun

Резюме на русском

#### Контекст В современной вычислительной биологии и машинном обучении, семейство генерирующих аддитивных моделей, таких как генеративные модели на основе гауссовых процессов (GP) и автокодирующих моделей (VAE), приобретает все больший интерес. Одна из причин этого является их универсальность и мощь в решении задач декомпозиции и структуры данных. Одна из узколистой областей исследований в этой сфере -- Инверсное Отбор Источников (ICA) -- представляет собой задачу разделения смешанных сигналов на независимые компоненты. Однако существующие подходы к ICA, основанные на GP, требуют высокого вычислительного времени и ресурсов, что ограничивает их применение в реальном времени и при больших данных. #### Метод Проведено разработку модели Structured Kernel Regression VAE (SKR-VAE) для решения задачи ICA с более высокой эффективностью. SKR-VAE основывается на идее структурированных кернелов, которые позволяют управлять связями между точками последовательностей в разных латентных пространствах. Ключевым элементом является использование регрессии кернела в качестве приближенного аналога гауссовых процессов. Это позволяет избежать вычислительно трудоемкого процесса обращения матрицы кернелов. Технически, SKR-VAE использует регрессионные модели с предварительными кернелами для моделирования взаимосвязи между латентными пространствами. Эта модель эффективна, так как она не требует полного вычисления матрицы кернела и предлагает более сжатый подход к ICA. #### Результаты В экспериментах SKR-VAE сравнивался с GP-VAE на различных данных. Результаты показали, что SKR-VAE достигает почти одинаковой точности в ICA, но с значительно меньшим вычислительным временем и требованиями к памяти. На больших данных, таких как MNIST, SKR-VAE показал существенный выигрыш в вычислительной эффективности, сократив время обучения в несколько раз по сравнению с GP-VAE. Это демонстрирует значительное потенциальное применение SKR-VAE в ситуациях, где вычислительная эффективность критическа. #### Значимость SKR-VAE предлагает решение для задач ICA с высоким уровнем вычислительной эффективности и меньшей нагрузкой на ресурсы. Он может использоваться в реализации генерирующих моделей в сложных задачах данных, таких как жизненные науки, медицина и анализ сигналов. Кроме того, он может быть наиболее эффективен в сценариях, где высокая скорость обработки данных является ключевым фактором, таких как мониторинг и видеоанализ. Этот подход может иметь значительное влияние на развитие более эффективных и скоростных генерирующих моделей. #### Выводы SKR-VAE достигает основных ц

Abstract

The interpretability of generative models is considered a key factor in demonstrating their effectiveness and controllability. The generated data are believed to be determined by latent variables that are not directly observable. Therefore, disentangling, decoupling, decomposing, causal inference, or performing Independent Component Analysis (ICA) in the latent variable space helps uncover the independent factors that influence the attributes or features affecting the generated outputs, thereby enhancing the interpretability of generative models. As a generative model, Variational Autoencoders (VAEs) combine with variational Bayesian inference algorithms. Using VAEs, the inverse process of ICA can be equivalently framed as a variational inference process. In some studies, Gaussian processes (GPs) have been introduced as priors for each dimension of latent variables in VAEs, structuring and separating each dimension from temporal or spatial perspectives, and encouraging different dimensions to control various attributes of the generated data. However, GPs impose a significant computational burden, resulting in substantial resource consumption when handling large datasets. Essentially, GPs model different temporal or spatial structures through various kernel functions. Structuring the priors of latent variables via kernel functions-so that different kernel functions model the correlations among sequence points within different latent dimensions-is at the core of achieving disentanglement in VAEs. The proposed Structured Kernel Regression VAE (SKR-VAE) leverages this core idea in a more efficient way, avoiding the costly kernel matrix inversion required in GPs. This research demonstrates that, while maintaining ICA performance, SKR-VAE achieves greater computational efficiency and significantly reduced computational burden compared to GP-VAE.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Structured Kernel Regression VAE: A Computationally Efficient Surrogate for GP-VAEs in ICA

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Comparison of neural network training strategies for the simulation of dynamical...

Informative missingness and its implications in semi-supervised learning

Recurrent Neural Networks with Linear Structures for Electricity Price Forecasti...

Control Consistency Losses for Diffusion Bridges

Foundations of Diffusion Models in General State Spaces: A Self-Contained Introd...

Навигация