Bounding Distributional Shifts in World Modeling through Novelty Detection
2508.06096v1
cs.RO, cs.AI
2025-08-12
Авторы:
Eric Jing, Abdeslam Boularias
Резюме на русском
#### Контекст
В последние годы мировые модели (world models), построенные на базе глубоких нейронных сетей, приобрели важное место в области управления и планирования движения для роботов. Эти модели позволяют предсказывать динамику среды и сделать прогнозируемым поведение системы в реальном времени. Однако существуют значительные проблемы, связанные с устойчивостью и дивергенцией, возникающими из-за спектральных и распределительных отклонений во время оптимизации. Эти проблемы сильно влияют на качество мировой модели во время инференции. Наша мотивация заключается в создании метода, улучшающего устойчивость и точность мировых моделей, даже при неполном данных во время обучения.
#### Метод
Для решения указанных проблем мы предлагаем использовать **variational autoencoder (VAE)** в качестве детектора необычностей (novelty detector). Эта модель распознает отклонения в траектории действий от тех, которые были применены во время обучения. Мировая модель, основанная на VAE, проверяет предлагаемые траектории действий на соответствие тренировочному дистрибутиву. Если отклонение выявляется, траектория отклоняется, чтобы избежать дивергенции модели. Мы также используем архитектуру **DINO-WM**, которая уже успешно применяется в моделировании мировых пространств для роботов.
#### Результаты
Мы провели эксперименты в симулированных средах с роботом, где требовалась сложность планирования и высокая точность моделирования. Мировая модель, расширенная VAE-детектором, показала существенное улучшение в данной области по сравнению с традиционными алгоритмами. Мы измерили **data efficiency** и **plan quality**, получив результаты, свидетельствующие о значительной улучшении в производительности и надежности. Также мы проводили сравнительные эксперименты с другими современными методами, подтверждая выигрыш в области данных и системных ресурсов.
#### Значимость
Предлагаемый подход к детектированию необычностей в мировых моделях может быть применен в различных областях, где важно обеспечивать работу моделей в условиях неполного данных или изменчивости среды. Например, в области машинного зрения, робототехники, и системах самовосстановления. Основное преимущество — улучшение устойчивости и эффективности моделирования в различных условиях. Это может способствовать более точному и надежному решению задач в условиях неопределенности, таких как ограниченные данные во время выполнения.
#### Выводы
В данной работе мы предложили новый подход к обеспечению устойчивости мировых моделей с помощью VAE-детектора. Мы показали, что наше решение улучшает качество и эффективность планирования в симулированных сре
Abstract
Recent work on visual world models shows significant promise in latent state
dynamics obtained from pre-trained image backbones. However, most of the
current approaches are sensitive to training quality, requiring near-complete
coverage of the action and state space during training to prevent divergence
during inference. To make a model-based planning algorithm more robust to the
quality of the learned world model, we propose in this work to use a
variational autoencoder as a novelty detector to ensure that proposed action
trajectories during planning do not cause the learned model to deviate from the
training data distribution. To evaluate the effectiveness of this approach, a
series of experiments in challenging simulated robot environments was carried
out, with the proposed method incorporated into a model-predictive control
policy loop extending the DINO-WM architecture. The results clearly show that
the proposed method improves over state-of-the-art solutions in terms of data
efficiency.
Ссылки и действия
Дополнительные ресурсы: