LuKAN: A Kolmogorov-Arnold Network Framework for 3D Human Motion Prediction
2508.04847v1
cs.CV
2025-08-09
Авторы:
Md Zahidul Hasan, A. Ben Hamza, Nizar Bouguila
Резюме на русском
3D-предсказание траекторий движения человека является важной задачей, но существующие модели часто сталкиваются с проблемами в сочетании высокой точности с эффективностью. Мы предлагаем LuKAN (LuKogorov-Arnold Network) — модель, основанную на Kolmogorov-Arnold Networks (KAN) с полиномами Лукаса в качестве активационных функций. Модель применяет дискретное преобразование Фурье для кодирования временных зависимостей, а специальный слой проекции позволяет учесть зависимости между суставами, обеспечивая консистентность структуры тела. На основе Temporal Dependency Learner, использующего KAN с полиномами Лукаса, LuKAN эффективно приближает функции с высоким качеством и малой сложностью. Наконец, инверсное преобразование Фурье восстанавливает последовательность движения в временном домене. Результаты экспериментов на трех бенчмарк-датасетах показали, что LuKAN эффективно преодолевает ограничения существующих моделей, обеспечивая высокую точность и низкую сложность.
Abstract
The goal of 3D human motion prediction is to forecast future 3D poses of the
human body based on historical motion data. Existing methods often face
limitations in achieving a balance between prediction accuracy and
computational efficiency. In this paper, we present LuKAN, an effective model
based on Kolmogorov-Arnold Networks (KANs) with Lucas polynomial activations.
Our model first applies the discrete wavelet transform to encode temporal
information in the input motion sequence. Then, a spatial projection layer is
used to capture inter-joint dependencies, ensuring structural consistency of
the human body. At the core of LuKAN is the Temporal Dependency Learner, which
employs a KAN layer parameterized by Lucas polynomials for efficient function
approximation. These polynomials provide computational efficiency and an
enhanced capability to handle oscillatory behaviors. Finally, the inverse
discrete wavelet transform reconstructs motion sequences in the time domain,
generating temporally coherent predictions. Extensive experiments on three
benchmark datasets demonstrate the competitive performance of our model
compared to strong baselines, as evidenced by both quantitative and qualitative
evaluations. Moreover, its compact architecture coupled with the linear
recurrence of Lucas polynomials, ensures computational efficiency.
Ссылки и действия
Дополнительные ресурсы: