Multi-Group Equivariant Augmentation for Reinforcement Learning in Robot Manipulation

2508.11204v1 cs.RO, cs.AI 2025-08-19
Авторы:

Hongbin Lin, Juan Rojas, Kwok Wai Samuel Au

Резюме на русском

## Контекст Использование визуально-моторных систем в реальном мире требует высокой эффективности семплинга для обучения моделей в ситуациях, где визуальные сигналы и моторные действия должны быть однозначно сопоставлены. Одной из подходящих индикуирующих моделей является симметрия задачи. Несмотря на то, что изометрические симметрии (применение одной и той же групповой трансформации ко всем объектам задачи на всех моментах времени) используются в многих работах, они не полностью учитывают неоднородные симметрии, которые могут присутствовать в реальных сценариях. Наша мотивация заключается в изучении неизометрических симметрий, которые могут улучшить эффективность обучения в системах-роботах. ## Метод Мы предлагаем новую формализацию частично наблюдаемого марковского процесса (POMDP), которая включает неизометрические симметрии. Эти симметрии учитывают различные групповые трансформации в пространственном и временном пространстве. Мы представляем метод Multi-Group Equivariance Augmentation (MEA), который использует несколько групповых трансформаций для применения разнообразия в обучающих данных. Для оценки симметрий мы предлагаем вольный вариант представления в виде ячеек, который сохраняет трансляционную эквивалентность. Метод MEA интегрируется с методом офлайн-реинфорсмента для повышения эффективности семплинга. ## Результаты Мы проводим эксперименты в двух сценариях манипуляции: доступ к железной лопате и управление робот-рукой. Для обучения используются данные симуляции с различными групповыми трансформациями. Мы сравниваем результаты MEA с существующими методами, такими как традиционные симметрии и без них. Обнаружено, что MEA позволяет улучшить эффективность семплинга и повысить точность обучения в ситуациях, где симметрии задачи неизометричны. Это достигается благодаря включению множественных групповых трансформаций и новым представлениям визуальных данных. ## Значимость Метод MEA может применяться в ситуациях, где требуется эффективное обучение визуально-моторных моделей, например, в системах-роботах, комплексных манипуляциях, где объекты имеют нестандартные симметрии. Он также может быть использован при отсутствии доступа к всеобъемлющим данным или когда требуется улучшение эффективности обучения. Наш подход может сделать системы-роботы более устойчивыми к различным условиям и увеличить их универсальность. ## Выводы Мы установили, что неизометрические симметрии могут значительно улучшить эффективност

Abstract

Sampling efficiency is critical for deploying visuomotor learning in real-world robotic manipulation. While task symmetry has emerged as a promising inductive bias to improve efficiency, most prior work is limited to isometric symmetries -- applying the same group transformation to all task objects across all timesteps. In this work, we explore non-isometric symmetries, applying multiple independent group transformations across spatial and temporal dimensions to relax these constraints. We introduce a novel formulation of the partially observable Markov decision process (POMDP) that incorporates the non-isometric symmetry structures, and propose a simple yet effective data augmentation method, Multi-Group Equivariance Augmentation (MEA). We integrate MEA with offline reinforcement learning to enhance sampling efficiency, and introduce a voxel-based visual representation that preserves translational equivariance. Extensive simulation and real-robot experiments across two manipulation domains demonstrate the effectiveness of our approach.

Ссылки и действия