Inference Time Debiasing Concepts in Diffusion Models

2508.14933v1 cs.GR, cs.AI, cs.LG 2025-08-23

Авторы:

Lucas S. Kupssinskü, Marco N. Bochernitsan, Jordan Kopper, Otávio Parraga, Rodrigo C. Barros

Резюме на русском

## Контекст Текстово-изображенческие модели генерации, основанные на технологии распространения (diffusion models), стали широко применяться для генерирования изображений на основе текстовых подсказок. Однако эти модели часто отображают сильные биазы, основанные на гендерных, этнических и возрастных атрибутах. Эти биазы могут привести к несправедливости и дискриминации в создаваемых изображениях, что нарушает принципы юмора и убедительности в большинстве сценариев. Несмотря на то, что существуют методы по борьбе с биазами в глубинных сетях, они либо требуют сложных модификаций моделей, либо оказываются трудоемкими в реализации и неэффективны в области генерации изображений. ## Метод Мы предлагаем DeCoDi — метод, изменяющий процедуру инференса в распространяющих моделях без изменения их основного обучения. Метод DeCoDi предназначен для создания цифровых изображений и базируется на добавлении специальных шумовых слоёв, изменяющих процесс распространения. Это позволяет избежать отбора признаков, связанных с заранее определёнными биазами. Данный подход оставляет неизменными слои модели, которые создают изображение, и не увеличивает вычислительные затраты. Благодаря этому, DeCoDi может быть легко интегрирован в любую модель распространения. ## Результаты Дебиазированое текстово-изображеческое генерирование произведено для трёх сценариев: гендер, этничность и возраст. Обучение проводилось на трёх наборах данных: Gender, Ethnicity, и Age. Чтобы оценить эффективность, изображения были проанализированы двумя независимыми оценщиками, которые оценили 1200 сгенерированных изображений на наличие биаз. Метриками оценки были разные реалии каждого сценария. Также проведена автоматическая оценка биаз с помощью GPT-4o. Результаты показали, что метод DeCoDi эффективно подавляет биазы, существующие в оригинальных моделях, с незначительными изменениями в качестве изображений. ## Значимость Метод DeCoDi может использоваться в широком кругу приложений, включая создание расширенных визуальных ресурсов, улучшение систем поиска изображений, и создание более универсальных текстово-изображечных моделей. Он предоставляет преимущество в своей простоте и независимости от изменений в модели. Также он может способствовать более честному использованию изображений в цифровых продуктах. ## Выводы Метод DeCoDi доказывает свою эффективность в дебиазировании текстово-изображительных моделей, основанных на распространении. Он легко интегрируется в существующие модели и не требует значительных изменений, что делает его

Abstract

We propose DeCoDi, a debiasing procedure for text-to-image diffusion-based models that changes the inference procedure, does not significantly change image quality, has negligible compute overhead, and can be applied in any diffusion-based image generation model. DeCoDi changes the diffusion process to avoid latent dimension regions of biased concepts. While most deep learning debiasing methods require complex or compute-intensive interventions, our method is designed to change only the inference procedure. Therefore, it is more accessible to a wide range of practitioners. We show the effectiveness of the method by debiasing for gender, ethnicity, and age for the concepts of nurse, firefighter, and CEO. Two distinct human evaluators manually inspect 1,200 generated images. Their evaluation results provide evidence that our method is effective in mitigating biases based on gender, ethnicity, and age. We also show that an automatic bias evaluation performed by the GPT4o is not significantly statistically distinct from a human evaluation. Our evaluation shows promising results, with reliable levels of agreement between evaluators and more coverage of protected attributes. Our method has the potential to significantly improve the diversity of images it generates by diffusion-based text-to-image generative models.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Inference Time Debiasing Concepts in Diffusion Models

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Neon: Negative Extrapolation From Self-Training Improves Image Generation

Навигация