The Information Dynamics of Generative Diffusion
2508.19897v1
stat.ML, cs.AI, cs.LG
2025-08-29
Авторы:
Luca Ambrogioni
Резюме на русском
#### Контекст
Generative diffusion models (GDM) являются мощным классом методов в машинном обучении, позволяющим генерировать высококачественные данные, подобные исходным. Однако их функционирование до сих пор остается частично непонятным. Одним из ключевых вопросов является понимание, как эти модели управляют структурой генерируемых данных, а также каковы характеристики генерируемых процессов. В настоящей работе мы предлагаем новый подход к исследованию этих вопросов, основываясь на идее информационной динамики, которая позволяет связать динамику генерируемых процессов с их информационно-теоретическими и термодинамическими свойствами.
#### Метод
Мы развиваем теоретическую модель, которая описывает процесс генерирования данных в рамках формализма информационной динамики. Эта модель основывается на диффузионных уравнениях Фоккера-Планка и информационно-теоретических показателях. Мы описываем процесс генерирования как процесс динамического сбалансирования шума и структуры, при котором система минимизирует её информационный разброс. Для этого используется векторное поле скорости, определяемое скоростью скорости сдвига, и сингулярность этого поля, которая определяет возможность продолжительности процесса. Мы также используем методы теории симметрий для анализа симметрий генерируемых процессов и их разрывов.
#### Результаты
Мы проводим эксперименты, используя стандартные датасеты, такие как CIFAR-10 и CelebA. Мы измеряем различные характеристики генерируемых процессов, включая скорость сдвига векторного поля, степень дисперсии и информационный разброс. Мы показываем, что генерируемые процессы имеют специфические характеристики, такие как синхронность шума в процессе, которая может быть изменена с помощью скорости скорости сдвига. Мы также показываем, что модель имеет гибкость в поддержании симметрий и их разрывов, которые могут привести к прорывам и новым решениям в процессе генерирования.
#### Значимость
Наш подход имеет широкие применения в области генерирования данных, в том числе в задачах генерирования текста, изображений и моделирования сложных систем. Он позволяет получать более стабильные и высококачественные результаты, снижая вероятность появления шума и неверных символов. Благодаря синтезу информационной динамики и термодинамики, мы можем лучше понять, как работают эти модели и как их можно оптимизировать. Это может привести к более эффективным алгоритмам и моделям в машинном обучении.
#### Выводы
Мы предлагаем новый синтез между инф
Abstract
Generative diffusion models have emerged as a powerful class of models in
machine learning, yet a unified theoretical understanding of their operation is
still developing. This perspective paper provides an integrated perspective on
generative diffusion by connecting their dynamic, information-theoretic, and
thermodynamic properties under a unified mathematical framework. We demonstrate
that the rate of conditional entropy production during generation (i.e. the
generative bandwidth) is directly governed by the expected divergence of the
score function's vector field. This divergence, in turn, is linked to the
branching of trajectories and generative bifurcations, which we characterize as
symmetry-breaking phase transitions in the energy landscape. This synthesis
offers a powerful insight: the process of generation is fundamentally driven by
the controlled, noise-induced breaking of (approximate) symmetries, where peaks
in information transfer correspond to critical transitions between possible
outcomes. The score function acts as a dynamic non-linear filter that regulates
the bandwidth of the noise by suppressing fluctuations that are incompatible
with the data.
Ссылки и действия
Дополнительные ресурсы: