Residual Neural Terminal Constraint for MPC-based Collision Avoidance in Dynamic Environments
2508.03428v1
cs.RO, cs.LG, cs.SY, eess.SY
2025-08-09
Авторы:
Bojan Derajić, Mohamed-Khalil Bouzidi, Sebastian Bernhard, Wolfgang Hönig
Резюме на русском
## Контекст
Планирование движения в динамических средах является ключевым задачей в робототехнике, автоматизированных системах и искусственном интеллекте. Одна из основных проблем в этой области — выживание и эффективное движение роботов в окружении движущихся объектов. Традиционные методы, основанные на моделях, часто сталкиваются с ограниченной точностью и реакцией на быстро меняющуюся среду. Задача заключается в разработке методов, которые обеспечат высокую точность и реакцию на изменения, сочетая в себе быстроту выполнения и эффективность.
## Метод
Мы предлагаем гибридную локальную планировщик для моделирования движения (Model Predictive Control, MPC), который использует нейронные сети для оценки значения функции времени. Функция значения вычисляется с помощью анализа Хейвенда-Яки (HJ), но его реализация в реальном времени невозможна. Мы предлагаем структуру, где значение функции выражается как разность между сигнальным расстоянием (signed distance function, SDF) и негативной функцией резидента. Негативная функция резидента представляется в виде нейронной сети, которая гарантирует реальное время выполнения. Такая структура позволяет получить оценку значения функции, которая не менее безопасна, чем SDF. Мы также параметризуем нейронную сеть с помощью hypernetwork, чтобы увеличить скорость обучения и улучшить общие свойства.
## Результаты
Мы провели эксперименты на симуляционных данных и на действительном оборудовании, сравнивая наш метод с тремя лучшими существующими методами. Результаты показывают, что наше решение позволяет повысить успешность задачи до 30% по сравнению с лучшим базовым методом. Наши результаты показали хорошую эффективность в реальном времени, не требуя значительного дополнительного ресурса. Это делает наш метод применимым в реальных ситуациях, где необходима быстрая реакция на изменения среды.
## Значимость
Метод может быть применен в различных сферах, включая автомобильную индустрию, летательные аппараты, роботы-охотники в трудных условиях. В отличие от традиционных методов, наше решение обеспечивает высокую скорость и высокое качество решения задачи движения. Это делает его полезным для ситуаций, где необходима быстрая реакция на изменения окружения. Мы также отмечаем, что параметризация сети через hypernetwork может быть отправной точкой для дальнейших исследований в области улучшения скорости и точности планирования.
## Выводы
Мы разработали новую модель MPC, которая использует нейронные сети для эффективного расчета значения функции времени в динамических средах. Это решение показало себя эффектив
Abstract
In this paper, we propose a hybrid MPC local planner that uses a
learning-based approximation of a time-varying safe set, derived from local
observations and applied as the MPC terminal constraint. This set can be
represented as a zero-superlevel set of the value function computed via
Hamilton-Jacobi (HJ) reachability analysis, which is infeasible in real-time.
We exploit the property that the HJ value function can be expressed as a
difference of the corresponding signed distance function (SDF) and a
non-negative residual function. The residual component is modeled as a neural
network with non-negative output and subtracted from the computed SDF,
resulting in a real-time value function estimate that is at least as safe as
the SDF by design. Additionally, we parametrize the neural residual by a
hypernetwork to improve real-time performance and generalization properties.
The proposed method is compared with three state-of-the-art methods in
simulations and hardware experiments, achieving up to 30\% higher success rates
compared to the best baseline while requiring a similar computational effort
and producing high-quality (low travel-time) solutions.