Learning and Optimization with 3D Orientations

2509.17274v1 cs.RO, cs.LG, math.OC 2025-09-24
Авторы:

Alexandros Ntagkas, Constantinos Tsakonas, Chairi Kiourt, Konstantinos Chatzilygeroudis

Резюме на русском

## Контекст Исследование 3D-ориентаций во многих областях, включая робототехнику и автоматизацию, является ключевым элементом для решения задач, в которых необходимо учитывать состояние инерции объектов или динамические процессы. Однако существует множество способов представления таких ориентаций, каждый из которых имеет определенные ограничения и уникальные особенности. Выбор наиболее подходящего представления для конкретной задачи часто представляет собой трудное задание, и существуют противоречивые мнения о том, какое представление лучше подходит для конкретной области задач. Даже более сложная ситуация возникает при работе с задачами, где требуется учитывать ориентации как входные, так и выходные параметры при обучении или оптимизации. В данной работе мы стремимся создать полный и унифицированный обзор всех доступных представлений 3D-ориентаций, включая технические решения и математические алгоритмы, и оценить их эффективность в практических сценариях. ## Метод Мы применяем универсальную методологию для изучения и сравнения представлений 3D-ориентаций в различных сценариях. Наши эксперименты охватывают 4 ключевых области: 1) **оптимизация напрямую**, где мы используем оптимизационные методы для нахождения решений в пространстве 3D-ориентаций; 2) **имитационное или супервизированное обучение с нейронным контроллером**, где мы обучаем модели, которые могут копировать или улучшать поведение в задачах с ориентациями; 3) **рекорд-ориентированное обучение с подкреплением**, где система учится взаимодействовать с окружением, оптимизируя поведение в задачах с ориентациями; 4) **дифференциальная динамическая оптимизация**, где мы использваем методы оптимизации, основанные на динамических моделях. Для каждого сценария мы используем различные математические представления, включая векторы, матрицы, комплексные числа и тензоры, а также методы алгебры Lie-групп. Эти методы позволяют более точно анализировать и сравнивать эффективность разных подходов. ## Результаты Выполнены сравнительные эксперименты, используя различные методы и представления 3D-ориентаций в реальных задачах. Мы экспериментировали с различными сценариями: изучение оптимальных путей, управление роботами в трехмерном пространстве и оптимизацию динамических систем. Наши результаты показали, что некоторые представления ориентаций дают более точные и быстрые результаты в зависимости от конкретной задачи. Например, в случае имитационного обучения нейронных сетей, представление в виде матриц оказалось более эффективным, в то время как в задачах оптими

Abstract

There exist numerous ways of representing 3D orientations. Each representation has both limitations and unique features. Choosing the best representation for one task is often a difficult chore, and there exist conflicting opinions on which representation is better suited for a set of family of tasks. Even worse, when dealing with scenarios where we need to learn or optimize functions with orientations as inputs and/or outputs, the set of possibilities (representations, loss functions, etc.) is even larger and it is not easy to decide what is best for each scenario. In this paper, we attempt to a) present clearly, concisely and with unified notation all available representations, and "tricks" related to 3D orientations (including Lie Group algebra), and b) benchmark them in representative scenarios. The first part feels like it is missing from the robotics literature as one has to read many different textbooks and papers in order have a concise and clear understanding of all possibilities, while the benchmark is necessary in order to come up with recommendations based on empirical evidence. More precisely, we experiment with the following settings that attempt to cover most widely used scenarios in robotics: 1) direct optimization, 2) imitation/supervised learning with a neural network controller, 3) reinforcement learning, and 4) trajectory optimization using differential dynamic programming. We finally provide guidelines depending on the scenario, and make available a reference implementation of all the orientation math described.

Ссылки и действия