📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 Reservoir Predictive Path Integral Control for Unknown Nonlinear Dynamics

2025-09-06

Авторы:

Daisuke Inoue, Tadayoshi Matsumori, Gouhei Tanaka, Yuji Ito

## Контекст Управление нелинейными динамическими системами представляет собой ключевую проблему в различных областях, включая робототехнику, энергетику и промышленность. Однако традиционные методы, такие как модельно-предиктивный управленческий (MPC) контроль, часто требуют значительных вычислительных ресурсов и предполагают полное знание динамических моделей систем. В случае неизвестных или недостаточно известных динамик, эти методы оказываются неэффективными. Одновременно, нейронные сети, интересующиеся проблемой аппроксимации нелинейных функций, стали обширно применяться в контроле данных. Необходимость быстного онлайн-обучения динамик, сочетанная с необходимостью эффективного управления, мотивирует развитие методологий, которые могут эффективно объединить эти подходы. ## Метод Предлагаемая методология, называемая Reservoir Predictive Path Integral (RPPI) control, строится на основе двух основных компонентов: Echo-state networks (ESN) и Model Predictive Path Integral (MPPI) control. ESN, являясь моделью вычислений с рекуррентными нейросетями, эффективно аппроксимирует неизвестные динамические модели. MPPI, в свою очередь, является контрольным подходом, основанным на семействе моделей Монте-Карло, который может работать с неизвестными динамическими моделями без нужды в их прямой моделировании. RPPI комбинирует эти две модели, используя ESN для быстрого онлайн-обучения динамики, а затем интегрирует эти модели в одноименный MPPI-контроль. Общая архитектура RPPI позволяет эффективно обучать динамику и распараллеливать вычисления MPPI, в то же время обойдя требования к линеаризации модели, которое обычно требуется в традиционных MPC-подходах. ## Результаты Для оценки эффективности RPPI, авторы провели эксперименты на двух разных системах: Duffing oscillator и four-tank system. Результаты показали, что URPPI не только улучшает управление, но и снижает контрольные затраты на до 60% по сравнению с традиционным задачным MPC. Эксперименты также подтвердили, что URPPI может эффективно обучаться в режиме реального времени, адаптируясь к изменениям в динамике системы. Особое внимание было уделено эксперименту с многоконфигурационным тестированием, чтобы продемонстрировать то, что РППИ может быстро аппроксимировать новые динамики и выполнять эффективное управление в различных условиях. ## Значимость Предлагаемый подход имеет широкое применение в технических областях, где необходимо быстрое онлайн-обучение динамики системы и эффективное управление. Особый потенциал URPPI заключается в его применении в системах с ограниченным доступом к моделям, таких как системы робото

Annotation:

Neural networks capable of approximating complex nonlinearities have found extensive application in data-driven control of nonlinear dynamical systems. However, fast online identification and control of unknown dynamics remain central challenges. This paper integrates echo-state networks (ESNs) -- reservoir computing models implemented with recurrent neural networks -- and model predictive path integral (MPPI) control -- sampling-based variants of model predictive control -- to meet these challe...

ID: 2509.03839v1 eess.SY, cs.LG, cs.SY, math.OC, nlin.CD

arXiv PDF