Kuramoto Orientation Diffusion Models

2509.15328v1 cs.LG, cs.CV, q-bio.NC 2025-09-23
Авторы:

Yue Song, T. Anderson Keller, Sevan Brodjian, Takeru Miyato, Yisong Yue, Pietro Perona, Max Welling

Резюме на русском

## Контекст Ориентация-богатые изображения, такие как отпечатки пальцев и текстуры, часто показывают выраженные паттерны направления, которые трудно моделировать с помощью стандартных генерирующих подходов, основанных на изотропных Евклидовых процессах диффузии. Мотивация для данного исследования лежит в интересных свойствах синхронизации в биологических системах, где Kuramoto-модели используются для описания синхронизации фаз нейронов или взаимодействия циркуляции крови. Мы предлагаем модель, основанную на Kuramoto-диффузии, для генерирования структурированных изображений, которая использует эти динамики для повышения структуры в процессе генерирования. ## Метод Мы предложили "Kuramoto Orientation Diffusion Models", основанную на стандартном шаге генерирующей модели с основанной на скор-функции, но с использованием новых динамических Kuramoto-синхронизации в качестве предварительного шага. Это дает нам возможность определить обратный процесс, работающий на совместных точках с передаточными функциями, подходящими для круговой геометрии изображений. Диффузия выполняет синхронизацию по фазам с использованием полиномиальной синхронности на основе скорейшей куртозности. Мы также разрабатывали специальные сети, которые учитывают циклическую геометрию изображений. Предлагаемая модель позволяет генерировать новые изображения с высоким уровнем структуры и детализации. ## Результаты Мы проверили модель на стандартных наборах данных изображений, а также на наборах, ориентированных на ориентацию, таких как отпечатки пальцев и текстуры. Результаты показали, что наши модели могут генерировать изображения с высоким уровнем детализации, и показали значительные повышения в качестве генерирования на ориентационно-богатых наборах данных. Мы также проверили, что наш подход работает эффективно в ситуациях, где существуют большие суммарные и синхронные динамики, которые трудно моделировать стандартными методами. ## Значимость Метод может использоваться в множестве применений, таких как поиск и создание новых текстур, моделирование естественных циклических динамик, и даже в системах по распознаванию отпечатков пальцев. Мы также доказали, что наш подход может решать проблемы с синхронизацией в генерировании изображений, которые нельзя решить стандартными подходами. В будущем мы планируем расширить модель, чтобы она могла синтезировать не только изображения, но и видео, используя аналогичные синхронизационные паттерны. ## Выводы Мы доказали, что новый подход, основанный на синхронизационных динамиках Kuramoto, может значительно повысить

Abstract

Orientation-rich images, such as fingerprints and textures, often exhibit coherent angular directional patterns that are challenging to model using standard generative approaches based on isotropic Euclidean diffusion. Motivated by the role of phase synchronization in biological systems, we propose a score-based generative model built on periodic domains by leveraging stochastic Kuramoto dynamics in the diffusion process. In neural and physical systems, Kuramoto models capture synchronization phenomena across coupled oscillators -- a behavior that we re-purpose here as an inductive bias for structured image generation. In our framework, the forward process performs \textit{synchronization} among phase variables through globally or locally coupled oscillator interactions and attraction to a global reference phase, gradually collapsing the data into a low-entropy von Mises distribution. The reverse process then performs \textit{desynchronization}, generating diverse patterns by reversing the dynamics with a learned score function. This approach enables structured destruction during forward diffusion and a hierarchical generation process that progressively refines global coherence into fine-scale details. We implement wrapped Gaussian transition kernels and periodicity-aware networks to account for the circular geometry. Our method achieves competitive results on general image benchmarks and significantly improves generation quality on orientation-dense datasets like fingerprints and textures. Ultimately, this work demonstrates the promise of biologically inspired synchronization dynamics as structured priors in generative modeling.

Ссылки и действия