Quantum Variational Activation Functions Empower Kolmogorov-Arnold Networks
2509.14026v1
quant-ph, cs.LG
2025-09-19
Авторы:
Jiun-Cheng Jiang, Morris Yu-Chao Huang, Tianlong Chen, Hsi-Sheng Goan
Резюме на русском
## Контекст
В области машинного обучения существует большой интерес к развитию алгоритмов, которые могут эффективно обрабатывать нелинейные задачи и улучшать общую точность моделей. Одной из актуальных площадок для исследований является использование квантовых вычислений в машинном обучении. Несмотря на то, что квантовые вычисления пока не достигли полного развития, они обещают значительные преимущества в обработке нелинейных задач. Одна из проблем в этой области заключается в том, что классические активационные функции часто не могут предоставить достаточную эффективность для реализации нелинейных моделей. В этом исследовании мы сосредоточились на сочетании квантовых методов и классических архитектур с целью оптимизации и улучшения общей точности моделей.
## Метод
Мы предлагаем использовать квантовые состояния, основанные на унитарных преобразованиях, для того, чтобы улучшить активационные функции в алгоритмах машинного обучения. Наша методика основывается на идее "дополнительной загрузки" данных в квантовый вычислитель, что позволяет создавать более гибкие модели. Мы изучаем свойства этих квантовых активационных функций, в частности, их экспериментальную стойкость и эффективность. Наша модель, которую мы называем **DARUAN** (DatA Re-Uploading ActivatioNs), включает в себя квантовые узлы, которые проходят через унитарные преобразования и инкапсулируют в себе принципы квантовых состояний. Мы также рассматриваем возможность использования квантовых активационных функций в сочетании с Kolmogorov-Arnold networks (KANs), чтобы создавать более мощные модели с повышенной точностью и эффективностью.
## Результаты
Мы провели эксперименты с использованием различных многомерных данных для регрессии и классификации. У нас были также проверены модели на задачах генерирования текста с помощью autoregressive моделей. Наши эксперименты показали, что DARUAN может значительно уменьшить количество параметров в модели, при этом сохраняя высокую точность и улучшая общую скорость обучения. Мы также проанализировали сходимость и точность нашей модели в сравнении с классическими активационными функциями, показав, что DARUAN предоставляет значительные преимущества в обработке сложных задач. Мы также показали, что наша модель может быть эффективно использована на нерешаемых для классических систем задачах, таких как нелинейные авторегрессионные модели.
## Значимость
Мы предлагаем новый подход к созданию моделей, которые могут использоваться в квантовых системах и классических системах. Наши результаты показывают, что DARUAN может быть применено в широком кругу задач, включая регрессионные проб
Abstract
Variational quantum circuits (VQCs) are central to quantum machine learning,
while recent progress in Kolmogorov-Arnold networks (KANs) highlights the power
of learnable activation functions. We unify these directions by introducing
quantum variational activation functions (QVAFs), realized through single-qubit
data re-uploading circuits called DatA Re-Uploading ActivatioNs (DARUANs). We
show that DARUAN with trainable weights in data pre-processing possesses an
exponentially growing frequency spectrum with data repetitions, enabling an
exponential reduction in parameter size compared with Fourier-based activations
without loss of expressivity. Embedding DARUAN into KANs yields
quantum-inspired KANs (QKANs), which retain the interpretability of KANs while
improving their parameter efficiency, expressivity, and generalization. We
further introduce two novel techniques to enhance scalability, feasibility and
computational efficiency, such as layer extension and hybrid QKANs (HQKANs) as
drop-in replacements of multi-layer perceptrons (MLPs) for feed-forward
networks in large-scale models. We provide theoretical analysis and extensive
experiments on function regression, image classification, and autoregressive
generative language modeling, demonstrating the efficiency and scalability of
QKANs. DARUANs and QKANs offer a promising direction for advancing quantum
machine learning on both noisy intermediate-scale quantum (NISQ) hardware and
classical quantum simulators.
Ссылки и действия
Дополнительные ресурсы: