On the Rate of Convergence of Kolmogorov-Arnold Network Regression Estimators

2509.19830v1 cs.LG, cs.AI, stat.ML 2025-09-26
Авторы:

Wei Liu, Eleni Chatzi, Zhilu Lai

Резюме на русском

## Контекст Колмогоров-Арнольд Нейронных Сетей (KANs) представляют собой структурированную и интерпретируемую модель для аппроксимации многомерных функций. Они достигают этого путем композиции унивариатных преобразований с использованием аддитивного или мультипликативного сложения. Такие сети позволяют эффективно аппроксимировать функции, не прибегая к высокомерновым нейронным сетям. Однако, необходима теоретическая основа, подтверждающая их эффективность и сходимость. Особенно актуальным является вопрос о скорости сходимости при использовании B-сплайнов, поскольку они широко используются в аппроксимации функций. Такие вопросы мотивируют развитие методов KANs и их применение в решении задач нейронной регрессии. ## Метод Мы рассматриваем модели KANs, где унивариатные преобразования выражаются с помощью B-сплайнов. Для доказательства сходимости мы используем методы теории вероятности и аппроксимации. Определяем понятие гладкости функции, оцениваемый с помощью Sobolev-классов. Используем методы схемы универсальной аппроксимации для доказательства минимакс-оптимальности скорости сходимости $O(n^{-2r/(2r+1)})$, где $r$ — гладкость функции. Для выбора оптимального числа кнопок в B-сплайнах, мы проводим анализ ошибки аппроксимации и получаем рекомендации на основе теоретических расчетов. Эти теории подкрепляются эмпирическими экспериментами. ## Результаты Наши эксперименты подтверждают предсказанные теоретические скорости сходимости. Мы проводим симуляции с использованием различных функций из Sobolev-классов и показываем, что KANs достигают желаемой скорости сходимости $O(n^{-2r/(2r+1)})$. Был проведен анализ числа кнопок в B-сплайнах, что позволило оптимизировать результаты. Эти результаты подтверждают теоретические ожидания и демонстрируют практическую эффективность KANs в нейронной регрессии. ## Значимость Мы устанавливаем новый теоретический фонд для использования KANs в многомерной нейронной регрессии. Наши результаты показывают, что KANs эффективны в аппроксимации функций многих переменных, особенно при высокой гладкости. Эти модели могут использоваться в таких областях, как финансы, климат окружающей среды, и медицина. Они предлагают структурированный и интерпретируемый подход к решению задач, где получение глобальных аппроксимаций неосновных функций необходимо. ## Выводы Мы установили минимакс-оптимальную скорость сходимости для KANs с использованием B-сплайнов и разработали рекоменда

Abstract

Kolmogorov-Arnold Networks (KANs) offer a structured and interpretable framework for multivariate function approximation by composing univariate transformations through additive or multiplicative aggregation. This paper establishes theoretical convergence guarantees for KANs when the univariate components are represented by B-splines. We prove that both additive and hybrid additive-multiplicative KANs attain the minimax-optimal convergence rate $O(n^{-2r/(2r+1)})$ for functions in Sobolev spaces of smoothness $r$. We further derive guidelines for selecting the optimal number of knots in the B-splines. The theory is supported by simulation studies that confirm the predicted convergence rates. These results provide a theoretical foundation for using KANs in nonparametric regression and highlight their potential as a structured alternative to existing methods.

Ссылки и действия