Asymmetric Diffusion Recommendation Model

2508.12706v1 cs.IR, cs.AI 2025-08-20
Авторы:

Yongchun Zhu, Guanyu Jiang, Jingwu Chen, Feng Zhang, Xiao Yang, Zuotao Liu

Резюме на русском

#### Контекст Современные рекомендательные системы сталкиваются с вызовами, связанными с несовершенством технологий, используемых для обработки неполных или нестандартных данных. Формирование точных рекомендаций требует устойчивых и персонализированных профилей пользователей. Однако несовершенность данных, такая как отсутствие фичи или их коррупция, существенно снижает качество рекомендаций. Заполнение пропусков в данных и создание устойчивых моделей остаются сложными задачами. В этой статье мы признаем эти проблемы и предлагаем новую модель, AsymDiffRec, которая способна более эффективно справляться с этими задачами. #### Метод Модель AsymDiffRec основывается на асимметричных процессах размывания и восстановления. Мы предлагаем уникальную оптимизацию, симулирующую недостающие данные в рекомендательных системах. Обратный процесс размывания происходит в заданном пространстве, отличном от стандартного нормального распределения. Это позволяет сохранить персонализацию в характеристиках пользователей. Мы также вводим задачи-ориентированную оптимизацию, которая гарантирует, что модель сформирует максимально полезные рекомендации. Эта модель может быть интегрирована с различными базовыми моделями рекомендаций, улучшая их производительность. #### Результаты Мы проверили AsymDiffRec на реальных данных с использованием нескольких основных моделей рекомендаций. Наши эксперименты показали, что модель повышает процент активных пользователей и продолжительность их сеансов в приложении на значительные проценты. Результаты на тестовой выборке показали, что AsymDiffRec превосходит стандартные модели, предлагая более точные и персонализированные рекомендации. Мы также провели расширенные оффлайн-эксперименты, установив улучшения качества рекомендаций в различных сценариях. #### Значимость Модель AsymDiffRec может быть использована в различных сферах, где необходимо обрабатывать неполные данные и улучшать качество рекомендаций. Например, она показала свою эффективность в музыкальных приложениях, где повышение активности пользователей и продолжительности сеансов является ключевым показателем. Эта модель также демонстрирует потенциал для применения в других областях, таких как электронная коммерция или поиск информации. #### Выводы Мы предложили AsymDiffRec — мощную модель для обработки неполных данных в рекомендательных системах. Модель показала свою эффективность в реальных условиях и была успешно реализована в Douyin Music App. Мы планируем продолжить исследования в области улучшения рекомендательных моделей, сфокусировавшись на повышении точности и устойчивости. Это даст возможность создавать более интеллектуальные и полезные системы рекомендаций.

Abstract

Recently, motivated by the outstanding achievements of diffusion models, the diffusion process has been employed to strengthen representation learning in recommendation systems. Most diffusion-based recommendation models typically utilize standard Gaussian noise in symmetric forward and reverse processes in continuous data space. Nevertheless, the samples derived from recommendation systems inhabit a discrete data space, which is fundamentally different from the continuous one. Moreover, Gaussian noise has the potential to corrupt personalized information within latent representations. In this work, we propose a novel and effective method, named Asymmetric Diffusion Recommendation Model (AsymDiffRec), which learns forward and reverse processes in an asymmetric manner. We define a generalized forward process that simulates the missing features in real-world recommendation samples. The reverse process is then performed in an asymmetric latent feature space. To preserve personalized information within the latent representation, a task-oriented optimization strategy is introduced. In the serving stage, the raw sample with missing features is regarded as a noisy input to generate a denoising and robust representation for the final prediction. By equipping base models with AsymDiffRec, we conduct online A/B tests, achieving improvements of +0.131% and +0.166% in terms of users' active days and app usage duration respectively. Additionally, the extended offline experiments also demonstrate improvements. AsymDiffRec has been implemented in the Douyin Music App.

Ссылки и действия