RotaTouille: Rotation Equivariant Deep Learning for Contours

2508.16359v1 cs.LG, cs.CV 2025-08-26
Авторы:

Odin Hoff Gardaa, Nello Blaser

Резюме на русском

## Контекст Обработка данных, связанных с замкнутыми плоскими кривыми (контурами), широко распространена в различных научных и практических областях. В компьютерном зрении контуры являются границами объектов, в метеорологии — изолиниями, в механике — орбитальными движениями. Одной из основных проблем при обработке таких данных является необходимость учитывать их геометрические свойства, в частности, их симметрии и последовательность точек. Исследователи стремятся разработать модели, которые бы способствовали эффективной обработке таких данных. В частности, необходимо, чтобы модели были симметричны по отношению к повороту и периодическим сдвигам. Однако, существующие подходы часто не достаточно эффективны или гибки в обработке таких специфичных задач. ## Метод Методология RotaTouille основывается на применении слоев сложных чисел с помощью круговых сверток. Это позволяет достичь эрмитовой гауссовой симметрии, что гарантирует циклическую и вращательную equivariance. Для построения моделей вводятся эквивариантные слои, включая нормализацию, коарсинг и глобальную агрегацию, которые делают модель более работоспособной. Также используется подход, основанный на порядке точек, чтобы учитывать геометрические свойства кривых. Этот подход позволяет лучше учитывать конкретные характеристики контуров, что улучшает точность моделей. ## Результаты В ходе экспериментов были проведены задачи классификации форм, реконструкции контуров и регрессии по данным контуров. Модель RotaTouille показала высокую точность и эффективность в этих задачах. Эксперименты проводились на различных датасетах, включая задачи, затрагивающие изолинии, объектные границы и другие типы контуров. Наилучшие результаты были достигнуты в сравнении с другими подходами, в частности, с подходами, не учитывающими эрмитовой симметрии. Это подтверждает эффективность нового подхода в обработке задач, требующих симметричности по отношению к повороту и периодическим движениям. ## Значимость RotaTouille может быть применена в различных областях, где требуется обработка контуров, таких как компьютерное зрение, методы землеведения, анализ навигационных данных. Основное преимущество заключается в том, что модель гарантирует эрмитовую симметрию, что делает её более гибкой и точной в обработке поворотов и сдвигов. Это позволяет улучшить качество решения задач, связанных с такими данными. Будущие исследования будут направлены на расширение модели и улучшение её производительности, а также на применение модели в новых сферах применения.

Abstract

Contours or closed planar curves are common in many domains. For example, they appear as object boundaries in computer vision, isolines in meteorology, and the orbits of rotating machinery. In many cases when learning from contour data, planar rotations of the input will result in correspondingly rotated outputs. It is therefore desirable that deep learning models be rotationally equivariant. In addition, contours are typically represented as an ordered sequence of edge points, where the choice of starting point is arbitrary. It is therefore also desirable for deep learning methods to be equivariant under cyclic shifts. We present RotaTouille, a deep learning framework for learning from contour data that achieves both rotation and cyclic shift equivariance through complex-valued circular convolution. We further introduce and characterize equivariant non-linearities, coarsening layers, and global pooling layers to obtain invariant representations for downstream tasks. Finally, we demonstrate the effectiveness of RotaTouille through experiments in shape classification, reconstruction, and contour regression.

Ссылки и действия