Bounding Distributional Shifts in World Modeling through Novelty Detection

2508.06096v1 cs.RO, cs.AI 2025-08-12

Авторы:

Eric Jing, Abdeslam Boularias

Резюме на русском

#### Контекст В последние годы мировые модели (world models), построенные на базе глубоких нейронных сетей, приобрели важное место в области управления и планирования движения для роботов. Эти модели позволяют предсказывать динамику среды и сделать прогнозируемым поведение системы в реальном времени. Однако существуют значительные проблемы, связанные с устойчивостью и дивергенцией, возникающими из-за спектральных и распределительных отклонений во время оптимизации. Эти проблемы сильно влияют на качество мировой модели во время инференции. Наша мотивация заключается в создании метода, улучшающего устойчивость и точность мировых моделей, даже при неполном данных во время обучения. #### Метод Для решения указанных проблем мы предлагаем использовать **variational autoencoder (VAE)** в качестве детектора необычностей (novelty detector). Эта модель распознает отклонения в траектории действий от тех, которые были применены во время обучения. Мировая модель, основанная на VAE, проверяет предлагаемые траектории действий на соответствие тренировочному дистрибутиву. Если отклонение выявляется, траектория отклоняется, чтобы избежать дивергенции модели. Мы также используем архитектуру **DINO-WM**, которая уже успешно применяется в моделировании мировых пространств для роботов. #### Результаты Мы провели эксперименты в симулированных средах с роботом, где требовалась сложность планирования и высокая точность моделирования. Мировая модель, расширенная VAE-детектором, показала существенное улучшение в данной области по сравнению с традиционными алгоритмами. Мы измерили **data efficiency** и **plan quality**, получив результаты, свидетельствующие о значительной улучшении в производительности и надежности. Также мы проводили сравнительные эксперименты с другими современными методами, подтверждая выигрыш в области данных и системных ресурсов. #### Значимость Предлагаемый подход к детектированию необычностей в мировых моделях может быть применен в различных областях, где важно обеспечивать работу моделей в условиях неполного данных или изменчивости среды. Например, в области машинного зрения, робототехники, и системах самовосстановления. Основное преимущество — улучшение устойчивости и эффективности моделирования в различных условиях. Это может способствовать более точному и надежному решению задач в условиях неопределенности, таких как ограниченные данные во время выполнения. #### Выводы В данной работе мы предложили новый подход к обеспечению устойчивости мировых моделей с помощью VAE-детектора. Мы показали, что наше решение улучшает качество и эффективность планирования в симулированных сре

Abstract

Recent work on visual world models shows significant promise in latent state dynamics obtained from pre-trained image backbones. However, most of the current approaches are sensitive to training quality, requiring near-complete coverage of the action and state space during training to prevent divergence during inference. To make a model-based planning algorithm more robust to the quality of the learned world model, we propose in this work to use a variational autoencoder as a novelty detector to ensure that proposed action trajectories during planning do not cause the learned model to deviate from the training data distribution. To evaluate the effectiveness of this approach, a series of experiments in challenging simulated robot environments was carried out, with the proposed method incorporated into a model-predictive control policy loop extending the DINO-WM architecture. The results clearly show that the proposed method improves over state-of-the-art solutions in terms of data efficiency.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Bounding Distributional Shifts in World Modeling through Novelty Detection

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Open-Ended Goal Inference through Actions and Language for Human-Robot Collabora...

Using Machine Learning to Take Stay-or-Go Decisions in Data-driven Drone Mission...

CRAFT-E: A Neuro-Symbolic Framework for Embodied Affordance Grounding

World Models for Autonomous Navigation of Terrestrial Robots from LIDAR Observat...

A Learning-based Control Methodology for Transitioning VTOL UAVs

Навигация