COMponent-Aware Pruning for Accelerated Control Tasks in Latent Space Models
2508.08144v1
cs.RO, cs.AI, cs.SY, eess.SY
2025-08-13
Авторы:
Ganesh Sundaram, Jonas Ulmen, Amjad Haider, Daniel Görges
Резюме на русском
## Контекст
Современные вычислительные системы, включая мобильные платформы, мобильные роботы, интернет-девайсы и подключенные устройства, становятся все более запрограммированными и автоматизированными. Это приводит к необходимости использовать компьютерные алгоритмы, оптимизированные под ресурсы, которые доступны в этих устройствах. Тем не менее, нейросетевые контроллеры (NNC), широко используемые для моделирования и управления динамическими системами, часто превышают допустимые требования к производительности и памяти. Это делает их выгрузку на практических устройствах сложной. Данная работа фокусируется на методах, которые позволяют сделать нейросетевые контроллеры более эффективными в плане ресурсов, при этом сохраняя качество управления.
## Метод
В этой работе предлагается методология, основанная на компонентно-ориентированной структурной усечении (component-aware structured pruning), которая позволяет определять оптимальную степень усечения для каждого раздела модели. Это сделано с целью балансировки между надежностью управления и эффективностью ресурсов. Метод был интегрирован в Temporal Difference Model Predictive Control (TD-MPC), современный алгоритм моделирования и контроля с использованием научных методов. Также в работе используются математические критерии стабильности, такие как Lyapunov-критерии, для гарантии устойчивости управления. Эта структурная усечение модели постоянно отслеживает критерии устойчивости, чтобы не допустить ухудшения управления.
## Результаты
Эксперименты проводились на реальных данных с использованием TD-MPC. Метод был протестирован на различных наборах данных, включая имитационные симуляции и реальные тестовые установки. Результаты показали, что процедура структурного усечения не только уменьшает требования к памяти и вычислениям, но и сохраняет показатели управления на уровне, достаточном для безопасного и эффективного использования в реальных устройствах. Также был определен теоретический предел, на котором модель может быть сжата, не нарушая стабильности управления.
## Значимость
Результаты этой работы могут быть применены в различных приложениях, включая мобильные роботы, интернет-девайсы и транспортные системы. Особым преимуществом является возможность изменения модели, обеспечивая оптимальную стабильность и производительность при минимальных требованиях к ресурсам. Это улучшает возможности создания эффективных систем управления, которые могут быть использованы в реальных устройствах. Это может привести к более широкому использованию нейросетевых моделей в практических приложениях, которые раньше были недо
Abstract
The rapid growth of resource-constrained mobile platforms, including mobile
robots, wearable systems, and Internet-of-Things devices, has increased the
demand for computationally efficient neural network controllers (NNCs) that can
operate within strict hardware limitations. While deep neural networks (DNNs)
demonstrate superior performance in control applications, their substantial
computational complexity and memory requirements present significant barriers
to practical deployment on edge devices. This paper introduces a comprehensive
model compression methodology that leverages component-aware structured pruning
to determine the optimal pruning magnitude for each pruning group, ensuring a
balance between compression and stability for NNC deployment. Our approach is
rigorously evaluated on Temporal Difference Model Predictive Control (TD-MPC),
a state-of-the-art model-based reinforcement learning algorithm, with a
systematic integration of mathematical stability guarantee properties,
specifically Lyapunov criteria. The key contribution of this work lies in
providing a principled framework for determining the theoretical limits of
model compression while preserving controller stability. Experimental
validation demonstrates that our methodology successfully reduces model
complexity while maintaining requisite control performance and stability
characteristics. Furthermore, our approach establishes a quantitative boundary
for safe compression ratios, enabling practitioners to systematically determine
the maximum permissible model reduction before violating critical stability
properties, thereby facilitating the confident deployment of compressed NNCs in
resource-limited environments.