Quantum Variational Activation Functions Empower Kolmogorov-Arnold Networks

2509.14026v1 quant-ph, cs.LG 2025-09-19
Авторы:

Jiun-Cheng Jiang, Morris Yu-Chao Huang, Tianlong Chen, Hsi-Sheng Goan

Резюме на русском

## Контекст В области машинного обучения существует большой интерес к развитию алгоритмов, которые могут эффективно обрабатывать нелинейные задачи и улучшать общую точность моделей. Одной из актуальных площадок для исследований является использование квантовых вычислений в машинном обучении. Несмотря на то, что квантовые вычисления пока не достигли полного развития, они обещают значительные преимущества в обработке нелинейных задач. Одна из проблем в этой области заключается в том, что классические активационные функции часто не могут предоставить достаточную эффективность для реализации нелинейных моделей. В этом исследовании мы сосредоточились на сочетании квантовых методов и классических архитектур с целью оптимизации и улучшения общей точности моделей. ## Метод Мы предлагаем использовать квантовые состояния, основанные на унитарных преобразованиях, для того, чтобы улучшить активационные функции в алгоритмах машинного обучения. Наша методика основывается на идее "дополнительной загрузки" данных в квантовый вычислитель, что позволяет создавать более гибкие модели. Мы изучаем свойства этих квантовых активационных функций, в частности, их экспериментальную стойкость и эффективность. Наша модель, которую мы называем **DARUAN** (DatA Re-Uploading ActivatioNs), включает в себя квантовые узлы, которые проходят через унитарные преобразования и инкапсулируют в себе принципы квантовых состояний. Мы также рассматриваем возможность использования квантовых активационных функций в сочетании с Kolmogorov-Arnold networks (KANs), чтобы создавать более мощные модели с повышенной точностью и эффективностью. ## Результаты Мы провели эксперименты с использованием различных многомерных данных для регрессии и классификации. У нас были также проверены модели на задачах генерирования текста с помощью autoregressive моделей. Наши эксперименты показали, что DARUAN может значительно уменьшить количество параметров в модели, при этом сохраняя высокую точность и улучшая общую скорость обучения. Мы также проанализировали сходимость и точность нашей модели в сравнении с классическими активационными функциями, показав, что DARUAN предоставляет значительные преимущества в обработке сложных задач. Мы также показали, что наша модель может быть эффективно использована на нерешаемых для классических систем задачах, таких как нелинейные авторегрессионные модели. ## Значимость Мы предлагаем новый подход к созданию моделей, которые могут использоваться в квантовых системах и классических системах. Наши результаты показывают, что DARUAN может быть применено в широком кругу задач, включая регрессионные проб

Abstract

Variational quantum circuits (VQCs) are central to quantum machine learning, while recent progress in Kolmogorov-Arnold networks (KANs) highlights the power of learnable activation functions. We unify these directions by introducing quantum variational activation functions (QVAFs), realized through single-qubit data re-uploading circuits called DatA Re-Uploading ActivatioNs (DARUANs). We show that DARUAN with trainable weights in data pre-processing possesses an exponentially growing frequency spectrum with data repetitions, enabling an exponential reduction in parameter size compared with Fourier-based activations without loss of expressivity. Embedding DARUAN into KANs yields quantum-inspired KANs (QKANs), which retain the interpretability of KANs while improving their parameter efficiency, expressivity, and generalization. We further introduce two novel techniques to enhance scalability, feasibility and computational efficiency, such as layer extension and hybrid QKANs (HQKANs) as drop-in replacements of multi-layer perceptrons (MLPs) for feed-forward networks in large-scale models. We provide theoretical analysis and extensive experiments on function regression, image classification, and autoregressive generative language modeling, demonstrating the efficiency and scalability of QKANs. DARUANs and QKANs offer a promising direction for advancing quantum machine learning on both noisy intermediate-scale quantum (NISQ) hardware and classical quantum simulators.

Ссылки и действия