Conditional-$t^3$VAE: Equitable Latent Space Allocation for Fair Generation
2509.02154v1
cs.LG, cs.AI, cs.CV, stat.ML
2025-09-05
Авторы:
Aymene Mohammed Bouayed, Samuel Deslauriers-Gauthier, Adrian Iaccovelli, David Naccache
Резюме на русском
## Контекст
В условиях имперфектной демографической представительности обучающих карт знаний в области глубокого обучения, наблюдается недостаточное внимание к генерируемой справедливости изображений. Ограниченный выбор изображений, относящихся к небольшим и зачастую незначимым классам, приводит к их ущемлению в полученных генеративных моделях. Одним из попыток устранить эту несоответствие стала разработка $t^3$VAE, которая использует тяжеловатый пир студентовского распределения. Однако существуют проблемы с неравномерностью распределения в латентном пространстве. Это проявляется в том, что латентное пространство все еще адаптируется к популярным классам, что делает процесс генерации несправедливым. Наша модель, Conditional-$t^3$VAE, предлагает решение этой проблемы.
## Метод
Conditional-$t^3$VAE расширяет подход $t^3$VAE, добавляя условие, чтобы латентное пространство было представлено всех классов равномерно. Мы вводим независимое условие, определяется на каждый класс, чтобы избежать того, что более популярные классы не ограничивают меньшие. Модель оптимизируется с помощью закрытого формулярного критерия оптимизации, основанного на использовании гамма-показателя искажения. Алгоритмы обучения определяют совместный перцептуальный пространственный объект, который используется для создания равномерного латентного пространства. Таким образом, мы можем сделать процесс генерации справедливым, даже когда имеется сильная неравномерность в классах.
## Результаты
Мы проверили Conditional-$t^3$VAE на трех наборах данных: SVHN-LT, CIFAR100-LT и CelebA, выбранных для их использования в императивных сценариях неравномерности. Мы сравнили результаты с $t^3$VAE и моделями с гауссовыми распределениями. Мы оценили модели с помощью FID-масштаба и F1-метрики. Модель Conditional-$t^3$VAE показала себя наиболее эффективной, особенно в ситуациях сильной неравномерности классов. Она предоставила лучшие результаты в FID-масштабе и показала постоянно высокую F1-метрику в различных классах, даже в ситуации с минимальной популярностью классов. Этот результат показал, что наш подход значительно повышает справедливость и разнообразие в генеративной модели.
## Значимость
Модель Conditional-$t^3$VAE может использоваться в различных приложениях, в том числе в ситуациях, где нужно обеспечить справедливость изображений. Модель хорошо работает в ситуациях императивной неравномерности классов. Мы также показали, что условие, определяемое в нашей модели, может быть применено для расширения генеративных моделей, чтобы они становилис
Abstract
Variational Autoencoders (VAEs) with global priors mirror the training set's
class frequency in latent space, underrepresenting tail classes and reducing
generative fairness on imbalanced datasets. While $t^3$VAE improves robustness
via heavy-tailed Student's t-distribution priors, it still allocates latent
volume proportionally to the class frequency.In this work, we address this
issue by explicitly enforcing equitable latent space allocation across classes.
To this end, we propose Conditional-$t^3$VAE, which defines a per-class
\mbox{Student's t} joint prior over latent and output variables, preventing
dominance by majority classes. Our model is optimized using a closed-form
objective derived from the $\gamma$-power divergence. Moreover, for
class-balanced generation, we derive an equal-weight latent mixture of
Student's t-distributions. On SVHN-LT, CIFAR100-LT, and CelebA,
Conditional-$t^3$VAE consistently achieves lower FID scores than both $t^3$VAE
and Gaussian-based VAE baselines, particularly under severe class imbalance. In
per-class F1 evaluations, Conditional-$t^3$VAE also outperforms the conditional
Gaussian VAE across all highly imbalanced settings. While Gaussian-based models
remain competitive under mild imbalance ratio ($\rho \lesssim 3$), our approach
substantially improves generative fairness and diversity in more extreme
regimes.