Projective Kolmogorov Arnold Neural Networks (P-KANs): Entropy-Driven Functional Space Discovery for Interpretable Machine Learning
2509.20049v1
cs.NE, cs.AI, cs.LG
2025-09-26
Авторы:
Alastair Poole, Stig McArthur, Saravan Kumar
Резюме на русском
## Контекст
Проблема исследования заключается в ограниченной точности и понимаемости моделей машинного обучения в области сложных задач, таких как синтез машин, обработка сигналов и другие специализированные приложения. Особенностью существующих методов является их неэффективность в условиях высокой размерности параметров, что приводит к переобучению и снижению общей устойчивости. Одна из причин этому является "непривязанная" многомерная сплайн-пространственная модель, которая недостаточно сжата и неэффективна в отношении вывода значимых характеристик. Мотивация заключается в развитии методов, которые могут сжимать пространство параметров с минимальными потерями точности и обеспечивать интерпретируемый вывод.
## Метод
Методология основывается на развитии Projective Kolmogorov-Arnold Networks (P-KANs), новаторного подхода к аппроксимации функций, в котором поиск интерпретируемых решений проводится с помощью минимизации энтропии пространства проекций. Функции представлены на основе сплайнов, при этом используется спектральное разложение (Fourier, Chebyshev, Bessel) для сжатия параметров. Архитектура P-KANs включает в себя специальное сжатие "непривязанного" пространства в узлах сети, чтобы нейронная сеть могла эффективно работать с представлениями, оптимальными для задачи. Эта техника основывается на анализе пространств проекций и градиентных методах, чтобы оптимизировать поведение модели в зоне минимума вариации.
## Результаты
Эксперименты были проведены на различных наборах данных, включая индустриальные задачи, такие как предсказание процессов автоматизированного волоконного размещения (Automated Fiber Placement, AFP). Показано, что P-KANs обеспечивают до 80% сокращения параметров, сохраняя высокую точность решения. Модель показала существенное сокращение в спектре ошибок, особенно в условиях шума. На основе этих результатов, модель продемонстрировала улучшенную устойчивость и интерпретируемость, что является ключевым преимуществом для применения в научных и промышленных приложениях.
## Значимость
Полученные результаты открывают новые перспективы для интерпретируемого машинного обучения в области сложных задач. P-KANs могут применяться в различных сферах, включая динамическую оптимизацию процессов, моделирование физических процессов и информационные системы. Основное преимущество заключается в сжатии пространства параметров и обеспечении точности, что позволяет использовать модель в реальных условиях. Будущие исследования будут направлены на улучшение методов сжатия, а также на расширение возможностей P-KANs в области сложных нелинейных задач.
## Выво
Abstract
Kolmogorov-Arnold Networks (KANs) relocate learnable nonlinearities from
nodes to edges, demonstrating remarkable capabilities in scientific machine
learning and interpretable modeling. However, current KAN implementations
suffer from fundamental inefficiencies due to redundancy in high-dimensional
spline parameter spaces, where numerous distinct parameterisations yield
functionally equivalent behaviors. This redundancy manifests as a "nuisance
space" in the model's Jacobian, leading to susceptibility to overfitting and
poor generalization. We introduce Projective Kolmogorov-Arnold Networks
(P-KANs), a novel training framework that guides edge function discovery
towards interpretable functional representations through entropy-minimisation
techniques from signal analysis and sparse dictionary learning. Rather than
constraining functions to predetermined spaces, our approach maintains spline
space flexibility while introducing "gravitational" terms that encourage
convergence towards optimal functional representations. Our key insight
recognizes that optimal representations can be identified through entropy
analysis of projection coefficients, compressing edge functions to
lower-parameter projective spaces (Fourier, Chebyshev, Bessel). P-KANs
demonstrate superior performance across multiple domains, achieving up to 80%
parameter reduction while maintaining representational capacity, significantly
improved robustness to noise compared to standard KANs, and successful
application to industrial automated fiber placement prediction. Our approach
enables automatic discovery of mixed functional representations where different
edges converge to different optimal spaces, providing both compression benefits
and enhanced interpretability for scientific machine learning applications.
Ссылки и действия
Дополнительные ресурсы: