COMponent-Aware Pruning for Accelerated Control Tasks in Latent Space Models

2508.08144v1 cs.RO, cs.AI, cs.SY, eess.SY 2025-08-13
Авторы:

Ganesh Sundaram, Jonas Ulmen, Amjad Haider, Daniel Görges

Резюме на русском

## Контекст Современные вычислительные системы, включая мобильные платформы, мобильные роботы, интернет-девайсы и подключенные устройства, становятся все более запрограммированными и автоматизированными. Это приводит к необходимости использовать компьютерные алгоритмы, оптимизированные под ресурсы, которые доступны в этих устройствах. Тем не менее, нейросетевые контроллеры (NNC), широко используемые для моделирования и управления динамическими системами, часто превышают допустимые требования к производительности и памяти. Это делает их выгрузку на практических устройствах сложной. Данная работа фокусируется на методах, которые позволяют сделать нейросетевые контроллеры более эффективными в плане ресурсов, при этом сохраняя качество управления. ## Метод В этой работе предлагается методология, основанная на компонентно-ориентированной структурной усечении (component-aware structured pruning), которая позволяет определять оптимальную степень усечения для каждого раздела модели. Это сделано с целью балансировки между надежностью управления и эффективностью ресурсов. Метод был интегрирован в Temporal Difference Model Predictive Control (TD-MPC), современный алгоритм моделирования и контроля с использованием научных методов. Также в работе используются математические критерии стабильности, такие как Lyapunov-критерии, для гарантии устойчивости управления. Эта структурная усечение модели постоянно отслеживает критерии устойчивости, чтобы не допустить ухудшения управления. ## Результаты Эксперименты проводились на реальных данных с использованием TD-MPC. Метод был протестирован на различных наборах данных, включая имитационные симуляции и реальные тестовые установки. Результаты показали, что процедура структурного усечения не только уменьшает требования к памяти и вычислениям, но и сохраняет показатели управления на уровне, достаточном для безопасного и эффективного использования в реальных устройствах. Также был определен теоретический предел, на котором модель может быть сжата, не нарушая стабильности управления. ## Значимость Результаты этой работы могут быть применены в различных приложениях, включая мобильные роботы, интернет-девайсы и транспортные системы. Особым преимуществом является возможность изменения модели, обеспечивая оптимальную стабильность и производительность при минимальных требованиях к ресурсам. Это улучшает возможности создания эффективных систем управления, которые могут быть использованы в реальных устройствах. Это может привести к более широкому использованию нейросетевых моделей в практических приложениях, которые раньше были недо

Abstract

The rapid growth of resource-constrained mobile platforms, including mobile robots, wearable systems, and Internet-of-Things devices, has increased the demand for computationally efficient neural network controllers (NNCs) that can operate within strict hardware limitations. While deep neural networks (DNNs) demonstrate superior performance in control applications, their substantial computational complexity and memory requirements present significant barriers to practical deployment on edge devices. This paper introduces a comprehensive model compression methodology that leverages component-aware structured pruning to determine the optimal pruning magnitude for each pruning group, ensuring a balance between compression and stability for NNC deployment. Our approach is rigorously evaluated on Temporal Difference Model Predictive Control (TD-MPC), a state-of-the-art model-based reinforcement learning algorithm, with a systematic integration of mathematical stability guarantee properties, specifically Lyapunov criteria. The key contribution of this work lies in providing a principled framework for determining the theoretical limits of model compression while preserving controller stability. Experimental validation demonstrates that our methodology successfully reduces model complexity while maintaining requisite control performance and stability characteristics. Furthermore, our approach establishes a quantitative boundary for safe compression ratios, enabling practitioners to systematically determine the maximum permissible model reduction before violating critical stability properties, thereby facilitating the confident deployment of compressed NNCs in resource-limited environments.

Ссылки и действия