LuKAN: A Kolmogorov-Arnold Network Framework for 3D Human Motion Prediction

2508.04847v1 cs.CV 2025-08-09
Авторы:

Md Zahidul Hasan, A. Ben Hamza, Nizar Bouguila

Резюме на русском

3D-предсказание траекторий движения человека является важной задачей, но существующие модели часто сталкиваются с проблемами в сочетании высокой точности с эффективностью. Мы предлагаем LuKAN (LuKogorov-Arnold Network) — модель, основанную на Kolmogorov-Arnold Networks (KAN) с полиномами Лукаса в качестве активационных функций. Модель применяет дискретное преобразование Фурье для кодирования временных зависимостей, а специальный слой проекции позволяет учесть зависимости между суставами, обеспечивая консистентность структуры тела. На основе Temporal Dependency Learner, использующего KAN с полиномами Лукаса, LuKAN эффективно приближает функции с высоким качеством и малой сложностью. Наконец, инверсное преобразование Фурье восстанавливает последовательность движения в временном домене. Результаты экспериментов на трех бенчмарк-датасетах показали, что LuKAN эффективно преодолевает ограничения существующих моделей, обеспечивая высокую точность и низкую сложность.

Abstract

The goal of 3D human motion prediction is to forecast future 3D poses of the human body based on historical motion data. Existing methods often face limitations in achieving a balance between prediction accuracy and computational efficiency. In this paper, we present LuKAN, an effective model based on Kolmogorov-Arnold Networks (KANs) with Lucas polynomial activations. Our model first applies the discrete wavelet transform to encode temporal information in the input motion sequence. Then, a spatial projection layer is used to capture inter-joint dependencies, ensuring structural consistency of the human body. At the core of LuKAN is the Temporal Dependency Learner, which employs a KAN layer parameterized by Lucas polynomials for efficient function approximation. These polynomials provide computational efficiency and an enhanced capability to handle oscillatory behaviors. Finally, the inverse discrete wavelet transform reconstructs motion sequences in the time domain, generating temporally coherent predictions. Extensive experiments on three benchmark datasets demonstrate the competitive performance of our model compared to strong baselines, as evidenced by both quantitative and qualitative evaluations. Moreover, its compact architecture coupled with the linear recurrence of Lucas polynomials, ensures computational efficiency.

Ссылки и действия