A Fast Initialization Method for Neural Network Controllers: A Case Study of Image-based Visual Servoing Control for the multicopter Interception
2509.19110v1
eess.SY, cs.LG, cs.RO, cs.SY
2025-09-25
Авторы:
Chenxu Ke, Congling Tian, Kaichen Xu, Ye Li, Lingcong Bao
Резюме на русском
## Контекст
Развитие нейронных сетей (NN) в сочетании с методами управления позволяет решать задачи в условиях сложности и неопределенности. Однако использование таких методов в контроле, например, в образно-ориентированной визуальной сервоподлюбке (image-based visual servoing, IBVS) для дронов, сталкивается с проблемами. Нейронные сети, используемые в качестве управляющих структур, часто требуют большого объема данных в начальной стадии обучения, что приводит к проблемам с производительностью и устойчивостью. Эти проблемы затрудняют применение таких методов в прикладных задачах, таких как захват изображений с помощью дронов.
## Метод
Предлагаемый подход основывается на стабилизированных методах управления, используя теорию Ляпунова для обеспечения стабильности нейронной сети в начальном этапе обучения. Метод заключается в построении набора данных, соответствующих условиям стабильности системы. Этот набор используется для инициализации нейронной сети управления, что позволяет сократить время обучения и улучшить качество результатов. Технически, метод включает в себя построение Lyapunov-функции, динамическую модель системы и структурированное набор данных, обеспечивающий условия устойчивости.
## Результаты
Эксперименты проводились на модели IBVS для легкого дрона. Начальная нейронная сеть была инициализирована с помощью построенных данных, что позволило достичь стабильного решения задачи управления. Результаты показали, что инициализированный подход позволил улучшить затраты на обучение и повысить точность контроля. Было достигнуто возможность достижения скорости захвата изображения в 15 м/с с помощью обученной нейронной сети. Это свидетельствует о практической эффективности метода.
## Значимость
Предлагаемый метод может быть применен в различных прикладных задачах, таких как сервоподъемники, роботы-инспекторы и дроны. Он позволяет существенно сократить время обучения нейронных сетей и повысить их надежность. Это имеет применение в робототехнике, видеонаблюдении, а также в задачах роботизированного управления. Эффективность метода подтверждена симуляционными и реальными испытаниями, что мотивирует его использование в разработке будущих систем управления.
## Выводы
Предложенный метод инициализации нейронных сетей является эффективным средством для ускорения обучения и повышения качества управления. Он работает в ситуациях, требующих высокой устойчивости и точности. В будущем планируется расширить его применение на другие типы управления, такие как мобильные роботы и многозеркальные системы. Также будут проводиться исследования по улучшению с
Abstract
Reinforcement learning-based controller design methods often require
substantial data in the initial training phase. Moreover, the training process
tends to exhibit strong randomness and slow convergence. It often requires
considerable time or high computational resources. Another class of
learning-based method incorporates Lyapunov stability theory to obtain a
control policy with stability guarantees. However, these methods generally
require an initially stable neural network control policy at the beginning of
training. Evidently, a stable neural network controller can not only serve as
an initial policy for reinforcement learning, allowing the training to focus on
improving controller performance, but also act as an initial state for
learning-based Lyapunov control methods. Although stable controllers can be
designed using traditional control theory, designers still need to have a great
deal of control design knowledge to address increasingly complicated control
problems. The proposed neural network rapid initialization method in this paper
achieves the initial training of the neural network control policy by
constructing datasets that conform to the stability conditions based on the
system model. Furthermore, using the image-based visual servoing control for
multicopter interception as a case study, simulations and experiments were
conducted to validate the effectiveness and practical performance of the
proposed method. In the experiment, the trained control policy attains a final
interception velocity of 15 m/s.