Bispectral OT: Dataset Comparison using Symmetry-Aware Optimal Transport

2509.20678v1 cs.LG, cs.AI, cs.CV, stat.ML 2025-09-26
Авторы:

Annabel Ma, Kaiying Hou, David Alvarez-Melis, Melanie Weber

Резюме на русском

## Контекст Техника оптимального транспорта (Optimal Transport, OT) широко используется в машинном обучении, графике и визуализации для установления однозначных сопоставлений между двумя распределениями или наборами данных. Однако в наборах данных, характеризующихся симметриями (например, визуальные симметрии в изображениях), подходы, основанные только на парных метриках геометрии, могут пропускать важные структуры данных. Такие проблемы часто приводят к потере контекста и неточности в сопоставлениях. Мы предлагаем Bispectral Optimal Transport (Bispectral OT) — расширение классической методологии OT, которое учитывает симметрии и позволяет получить более точные и смысловые сопоставления. ## Метод Bispectral Optimal Transport использует биспектру — групповую Фурье-инварианту — для представления элементов в наборе данных. В отличие от стандартного OT, который оперирует парами координат, Bispectral OT учитывает не только локальные отношения, но и глобальные структуры данных. Эта техника сохраняет все сигнальные свойства, вычитая только симметричные колебания. Мы реализуем Bispectral OT в качестве расширения задачи оптимального транспорта, используя новый класс мер расстояний, основанных на биспектре. Это позволяет произвести более точные сопоставления, которые сохраняют классовую структуру данных, независимо от визуальных симметрий. ## Результаты Мы проверили Bispectral OT на нескольких задачах синтетических и реальных данных, включая изображения, подвергнутые различным визуальным симметриям. Наши эксперименты показали, что метод Bispectral OT превосходит классический OT в задачах классового сохранения и однозначности сопоставлений. Например, при изменении изображений в холсте симметричной преобразовательной группы, Bispectral OT позволяет учитывать основные свойства классов (например, геометрические формы), даже когда они преобразуются симметрически. Эти результаты подтверждают, что Bispectral OT не только улучшает точность, но и позволяет определять более подробные и контекстуально значимые сопоставления. ## Значимость Вычислительный метод Bispectral OT может быть применен в сложных сценариях, где важна сохраняемость классов и удаление ненужных симметричных колебаний. Он применим в графике, где необходимо удалить ненужные визуальные симметрии при анализе изображений. Более того, Bispectral OT может быть использован в обработке естественных языков, где симметрии в семантической структуре могут затруднять понимание. Этот подход открывает новые пути для повышения точности и смысловой нагрузки в задачах машинного обучения, затрагивающих высокомерный анализ распределений. ## Выводы Наше и

Abstract

Optimal transport (OT) is a widely used technique in machine learning, graphics, and vision that aligns two distributions or datasets using their relative geometry. In symmetry-rich settings, however, OT alignments based solely on pairwise geometric distances between raw features can ignore the intrinsic coherence structure of the data. We introduce Bispectral Optimal Transport, a symmetry-aware extension of discrete OT that compares elements using their representation using the bispectrum, a group Fourier invariant that preserves all signal structure while removing only the variation due to group actions. Empirically, we demonstrate that the transport plans computed with Bispectral OT achieve greater class preservation accuracy than naive feature OT on benchmark datasets transformed with visual symmetries, improving the quality of meaningful correspondences that capture the underlying semantic label structure in the dataset while removing nuisance variation not affecting class or content.

Ссылки и действия