Residual Neural Terminal Constraint for MPC-based Collision Avoidance in Dynamic Environments

2508.03428v1 cs.RO, cs.LG, cs.SY, eess.SY 2025-08-09

Авторы:

Bojan Derajić, Mohamed-Khalil Bouzidi, Sebastian Bernhard, Wolfgang Hönig

Резюме на русском

## Контекст Планирование движения в динамических средах является ключевым задачей в робототехнике, автоматизированных системах и искусственном интеллекте. Одна из основных проблем в этой области — выживание и эффективное движение роботов в окружении движущихся объектов. Традиционные методы, основанные на моделях, часто сталкиваются с ограниченной точностью и реакцией на быстро меняющуюся среду. Задача заключается в разработке методов, которые обеспечат высокую точность и реакцию на изменения, сочетая в себе быстроту выполнения и эффективность. ## Метод Мы предлагаем гибридную локальную планировщик для моделирования движения (Model Predictive Control, MPC), который использует нейронные сети для оценки значения функции времени. Функция значения вычисляется с помощью анализа Хейвенда-Яки (HJ), но его реализация в реальном времени невозможна. Мы предлагаем структуру, где значение функции выражается как разность между сигнальным расстоянием (signed distance function, SDF) и негативной функцией резидента. Негативная функция резидента представляется в виде нейронной сети, которая гарантирует реальное время выполнения. Такая структура позволяет получить оценку значения функции, которая не менее безопасна, чем SDF. Мы также параметризуем нейронную сеть с помощью hypernetwork, чтобы увеличить скорость обучения и улучшить общие свойства. ## Результаты Мы провели эксперименты на симуляционных данных и на действительном оборудовании, сравнивая наш метод с тремя лучшими существующими методами. Результаты показывают, что наше решение позволяет повысить успешность задачи до 30% по сравнению с лучшим базовым методом. Наши результаты показали хорошую эффективность в реальном времени, не требуя значительного дополнительного ресурса. Это делает наш метод применимым в реальных ситуациях, где необходима быстрая реакция на изменения среды. ## Значимость Метод может быть применен в различных сферах, включая автомобильную индустрию, летательные аппараты, роботы-охотники в трудных условиях. В отличие от традиционных методов, наше решение обеспечивает высокую скорость и высокое качество решения задачи движения. Это делает его полезным для ситуаций, где необходима быстрая реакция на изменения окружения. Мы также отмечаем, что параметризация сети через hypernetwork может быть отправной точкой для дальнейших исследований в области улучшения скорости и точности планирования. ## Выводы Мы разработали новую модель MPC, которая использует нейронные сети для эффективного расчета значения функции времени в динамических средах. Это решение показало себя эффектив

Abstract

In this paper, we propose a hybrid MPC local planner that uses a learning-based approximation of a time-varying safe set, derived from local observations and applied as the MPC terminal constraint. This set can be represented as a zero-superlevel set of the value function computed via Hamilton-Jacobi (HJ) reachability analysis, which is infeasible in real-time. We exploit the property that the HJ value function can be expressed as a difference of the corresponding signed distance function (SDF) and a non-negative residual function. The residual component is modeled as a neural network with non-negative output and subtracted from the computed SDF, resulting in a real-time value function estimate that is at least as safe as the SDF by design. Additionally, we parametrize the neural residual by a hypernetwork to improve real-time performance and generalization properties. The proposed method is compared with three state-of-the-art methods in simulations and hardware experiments, achieving up to 30\% higher success rates compared to the best baseline while requiring a similar computational effort and producing high-quality (low travel-time) solutions.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Residual Neural Terminal Constraint for MPC-based Collision Avoidance in Dynamic Environments

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Constraint-Aware Reinforcement Learning via Adaptive Action Scaling

Stabilizing Humanoid Robot Trajectory Generation via Physics-Informed Learning a...

ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functi...

Prepare Before You Act: Learning From Humans to Rearrange Initial States

Adaptive Model-Predictive Control of a Soft Continuum Robot Using a Physics-Info...

Навигация