Kuramoto Orientation Diffusion Models
2509.15328v1
cs.LG, cs.CV, q-bio.NC
2025-09-23
Авторы:
Yue Song, T. Anderson Keller, Sevan Brodjian, Takeru Miyato, Yisong Yue, Pietro Perona, Max Welling
Резюме на русском
## Контекст
Ориентация-богатые изображения, такие как отпечатки пальцев и текстуры, часто показывают выраженные паттерны направления, которые трудно моделировать с помощью стандартных генерирующих подходов, основанных на изотропных Евклидовых процессах диффузии. Мотивация для данного исследования лежит в интересных свойствах синхронизации в биологических системах, где Kuramoto-модели используются для описания синхронизации фаз нейронов или взаимодействия циркуляции крови. Мы предлагаем модель, основанную на Kuramoto-диффузии, для генерирования структурированных изображений, которая использует эти динамики для повышения структуры в процессе генерирования.
## Метод
Мы предложили "Kuramoto Orientation Diffusion Models", основанную на стандартном шаге генерирующей модели с основанной на скор-функции, но с использованием новых динамических Kuramoto-синхронизации в качестве предварительного шага. Это дает нам возможность определить обратный процесс, работающий на совместных точках с передаточными функциями, подходящими для круговой геометрии изображений. Диффузия выполняет синхронизацию по фазам с использованием полиномиальной синхронности на основе скорейшей куртозности. Мы также разрабатывали специальные сети, которые учитывают циклическую геометрию изображений. Предлагаемая модель позволяет генерировать новые изображения с высоким уровнем структуры и детализации.
## Результаты
Мы проверили модель на стандартных наборах данных изображений, а также на наборах, ориентированных на ориентацию, таких как отпечатки пальцев и текстуры. Результаты показали, что наши модели могут генерировать изображения с высоким уровнем детализации, и показали значительные повышения в качестве генерирования на ориентационно-богатых наборах данных. Мы также проверили, что наш подход работает эффективно в ситуациях, где существуют большие суммарные и синхронные динамики, которые трудно моделировать стандартными методами.
## Значимость
Метод может использоваться в множестве применений, таких как поиск и создание новых текстур, моделирование естественных циклических динамик, и даже в системах по распознаванию отпечатков пальцев. Мы также доказали, что наш подход может решать проблемы с синхронизацией в генерировании изображений, которые нельзя решить стандартными подходами. В будущем мы планируем расширить модель, чтобы она могла синтезировать не только изображения, но и видео, используя аналогичные синхронизационные паттерны.
## Выводы
Мы доказали, что новый подход, основанный на синхронизационных динамиках Kuramoto, может значительно повысить
Abstract
Orientation-rich images, such as fingerprints and textures, often exhibit
coherent angular directional patterns that are challenging to model using
standard generative approaches based on isotropic Euclidean diffusion.
Motivated by the role of phase synchronization in biological systems, we
propose a score-based generative model built on periodic domains by leveraging
stochastic Kuramoto dynamics in the diffusion process. In neural and physical
systems, Kuramoto models capture synchronization phenomena across coupled
oscillators -- a behavior that we re-purpose here as an inductive bias for
structured image generation. In our framework, the forward process performs
\textit{synchronization} among phase variables through globally or locally
coupled oscillator interactions and attraction to a global reference phase,
gradually collapsing the data into a low-entropy von Mises distribution. The
reverse process then performs \textit{desynchronization}, generating diverse
patterns by reversing the dynamics with a learned score function. This approach
enables structured destruction during forward diffusion and a hierarchical
generation process that progressively refines global coherence into fine-scale
details. We implement wrapped Gaussian transition kernels and periodicity-aware
networks to account for the circular geometry. Our method achieves competitive
results on general image benchmarks and significantly improves generation
quality on orientation-dense datasets like fingerprints and textures.
Ultimately, this work demonstrates the promise of biologically inspired
synchronization dynamics as structured priors in generative modeling.
Ссылки и действия
Дополнительные ресурсы: