The Information Dynamics of Generative Diffusion

2508.19897v1 stat.ML, cs.AI, cs.LG 2025-08-29
Авторы:

Luca Ambrogioni

Резюме на русском

#### Контекст Generative diffusion models (GDM) являются мощным классом методов в машинном обучении, позволяющим генерировать высококачественные данные, подобные исходным. Однако их функционирование до сих пор остается частично непонятным. Одним из ключевых вопросов является понимание, как эти модели управляют структурой генерируемых данных, а также каковы характеристики генерируемых процессов. В настоящей работе мы предлагаем новый подход к исследованию этих вопросов, основываясь на идее информационной динамики, которая позволяет связать динамику генерируемых процессов с их информационно-теоретическими и термодинамическими свойствами. #### Метод Мы развиваем теоретическую модель, которая описывает процесс генерирования данных в рамках формализма информационной динамики. Эта модель основывается на диффузионных уравнениях Фоккера-Планка и информационно-теоретических показателях. Мы описываем процесс генерирования как процесс динамического сбалансирования шума и структуры, при котором система минимизирует её информационный разброс. Для этого используется векторное поле скорости, определяемое скоростью скорости сдвига, и сингулярность этого поля, которая определяет возможность продолжительности процесса. Мы также используем методы теории симметрий для анализа симметрий генерируемых процессов и их разрывов. #### Результаты Мы проводим эксперименты, используя стандартные датасеты, такие как CIFAR-10 и CelebA. Мы измеряем различные характеристики генерируемых процессов, включая скорость сдвига векторного поля, степень дисперсии и информационный разброс. Мы показываем, что генерируемые процессы имеют специфические характеристики, такие как синхронность шума в процессе, которая может быть изменена с помощью скорости скорости сдвига. Мы также показываем, что модель имеет гибкость в поддержании симметрий и их разрывов, которые могут привести к прорывам и новым решениям в процессе генерирования. #### Значимость Наш подход имеет широкие применения в области генерирования данных, в том числе в задачах генерирования текста, изображений и моделирования сложных систем. Он позволяет получать более стабильные и высококачественные результаты, снижая вероятность появления шума и неверных символов. Благодаря синтезу информационной динамики и термодинамики, мы можем лучше понять, как работают эти модели и как их можно оптимизировать. Это может привести к более эффективным алгоритмам и моделям в машинном обучении. #### Выводы Мы предлагаем новый синтез между инф

Abstract

Generative diffusion models have emerged as a powerful class of models in machine learning, yet a unified theoretical understanding of their operation is still developing. This perspective paper provides an integrated perspective on generative diffusion by connecting their dynamic, information-theoretic, and thermodynamic properties under a unified mathematical framework. We demonstrate that the rate of conditional entropy production during generation (i.e. the generative bandwidth) is directly governed by the expected divergence of the score function's vector field. This divergence, in turn, is linked to the branching of trajectories and generative bifurcations, which we characterize as symmetry-breaking phase transitions in the energy landscape. This synthesis offers a powerful insight: the process of generation is fundamentally driven by the controlled, noise-induced breaking of (approximate) symmetries, where peaks in information transfer correspond to critical transitions between possible outcomes. The score function acts as a dynamic non-linear filter that regulates the bandwidth of the noise by suppressing fluctuations that are incompatible with the data.

Ссылки и действия