Shortcut Learning in Generalist Robot Policies: The Role of Dataset Diversity and Fragmentation

2508.06426v1 cs.RO, cs.AI, cs.CV 2025-08-12

Авторы:

Youguang Xing, Xu Luo, Junlin Xie, Lianli Gao, Hengtao Shen, Jingkuan Song

Резюме на русском

## Контекст Область исследования связана с развитием общих (generalist) политик действий (policies) для роботов, которые могут выполнять широкий спектр задач в разных средах. Актуальной проблемой в этой области является ограниченность моделей в области общей целесообразности (generalization capability) — возникающая из-за того, что модели, при недостаточном разнообразии в обучающих данных, начинают опираться на специфические, но не значимые для решения задачи фичи (shortcut learning). Это проблема становится особенно яркой при работе с большими датасетами, которые состоят из независимых поддатасетов, собранных в различных условиях. Целью работы является не только идентификация факторов, которые способствуют этой проблеме, но и поиск способов ее устранения. ## Метод Для научного исследования использовались два основных подхода. Во-первых, был проведен теоретический анализ, позволяющий выявить основные причины shortcut learning — недостаточную разнообразность в поддатасетах и значимые различия в их распределениях (dataset fragmentation). Во-вторых, проводились эмпирические эксперименты, в ходе которых были протестированы различные модели на разных поддатасетах, а также на варьированных вариантах данных с помощью техник разметки и аугментации. Таким образом, было установлено, как разнообразие и структура данных влияют на общую способность модели к общей целесообразности. ## Результаты В ходе экспериментов был выявлен, что роботские модели, обученные на недостаточно разнообразных или сильно разбитых поддатасетах, используют в своих решениях сильно зависящие от контекста, но незначимые для задачи фичи. Были проведены ряд экспериментов с аугментацией данных, которые показали, что стратегия добавления новых, разнообразных обучающих примеров может существенно улучшить общую способность модели. Также были проанализированы результаты работы моделей на различных симуляционных и реальных задачах, что подтвердило тот факт, что улучшение разнообразия данных и их структуры позволяет значительно снизить уровень shortcut learning. ## Значимость Результаты работы имеют практическое значение для развития общих моделей действий для роботов. Они позволяют улучшить общую способность моделей, уменьшая риск зависимости от незначимых для задачи фич. Это влечет за собой рост эффективности в различных приложениях, включая управление роботами в различных ситуациях, включая нестандартные. Данные подходы также могут быть применены в учебных датасетах для роботов, чтобы снизить риск ошибок в ситуациях, где новые данные недоступны или дорогостоящи. ## Выводы Основным достижением является выявление того, что ограниченность раз

Abstract

Generalist robot policies trained on large-scale datasets such as Open X-Embodiment (OXE) demonstrate strong performance across a wide range of tasks. However, they often struggle to generalize beyond the distribution of their training data. In this paper, we investigate the underlying cause of this limited generalization capability. We identify shortcut learning -- the reliance on task-irrelevant features -- as a key impediment to generalization. Through comprehensive theoretical and empirical analysis, we uncover two primary contributors to shortcut learning: (1) limited diversity within individual sub-datasets, and (2) significant distributional disparities across sub-datasets, leading to dataset fragmentation. These issues arise from the inherent structure of large-scale datasets like OXE, which are typically composed of multiple sub-datasets collected independently across varied environments and embodiments. Our findings provide critical insights into dataset collection strategies that can reduce shortcut learning and enhance the generalization ability of generalist robot policies. Moreover, in scenarios where acquiring new large-scale data is impractical, we demonstrate that carefully selected robotic data augmentation strategies can effectively reduce shortcut learning in existing offline datasets, thereby improving generalization capabilities of generalist robot policies, e.g., $\pi_0$, in both simulation and real-world environments. More information at https://lucky-light-sun.github.io/proj/shortcut-learning-in-grps/.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Shortcut Learning in Generalist Robot Policies: The Role of Dataset Diversity and Fragmentation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Distracted Robot: How Visual Clutter Undermine Robotic Manipulation

Obstruction reasoning for robotic grasping

RealAppliance: Let High-fidelity Appliance Assets Controllable and Workable as A...

SocialNav: Training Human-Inspired Foundation Model for Socially-Aware Embodied ...

Stable Multi-Drone GNSS Tracking System for Marine Robots

Навигация