Asymmetric Diffusion Recommendation Model
2508.12706v1
cs.IR, cs.AI
2025-08-20
Авторы:
Yongchun Zhu, Guanyu Jiang, Jingwu Chen, Feng Zhang, Xiao Yang, Zuotao Liu
Резюме на русском
#### Контекст
Современные рекомендательные системы сталкиваются с вызовами, связанными с несовершенством технологий, используемых для обработки неполных или нестандартных данных. Формирование точных рекомендаций требует устойчивых и персонализированных профилей пользователей. Однако несовершенность данных, такая как отсутствие фичи или их коррупция, существенно снижает качество рекомендаций. Заполнение пропусков в данных и создание устойчивых моделей остаются сложными задачами. В этой статье мы признаем эти проблемы и предлагаем новую модель, AsymDiffRec, которая способна более эффективно справляться с этими задачами.
#### Метод
Модель AsymDiffRec основывается на асимметричных процессах размывания и восстановления. Мы предлагаем уникальную оптимизацию, симулирующую недостающие данные в рекомендательных системах. Обратный процесс размывания происходит в заданном пространстве, отличном от стандартного нормального распределения. Это позволяет сохранить персонализацию в характеристиках пользователей. Мы также вводим задачи-ориентированную оптимизацию, которая гарантирует, что модель сформирует максимально полезные рекомендации. Эта модель может быть интегрирована с различными базовыми моделями рекомендаций, улучшая их производительность.
#### Результаты
Мы проверили AsymDiffRec на реальных данных с использованием нескольких основных моделей рекомендаций. Наши эксперименты показали, что модель повышает процент активных пользователей и продолжительность их сеансов в приложении на значительные проценты. Результаты на тестовой выборке показали, что AsymDiffRec превосходит стандартные модели, предлагая более точные и персонализированные рекомендации. Мы также провели расширенные оффлайн-эксперименты, установив улучшения качества рекомендаций в различных сценариях.
#### Значимость
Модель AsymDiffRec может быть использована в различных сферах, где необходимо обрабатывать неполные данные и улучшать качество рекомендаций. Например, она показала свою эффективность в музыкальных приложениях, где повышение активности пользователей и продолжительности сеансов является ключевым показателем. Эта модель также демонстрирует потенциал для применения в других областях, таких как электронная коммерция или поиск информации.
#### Выводы
Мы предложили AsymDiffRec — мощную модель для обработки неполных данных в рекомендательных системах. Модель показала свою эффективность в реальных условиях и была успешно реализована в Douyin Music App. Мы планируем продолжить исследования в области улучшения рекомендательных моделей, сфокусировавшись на повышении точности и устойчивости. Это даст возможность создавать более интеллектуальные и полезные системы рекомендаций.
Abstract
Recently, motivated by the outstanding achievements of diffusion models, the
diffusion process has been employed to strengthen representation learning in
recommendation systems. Most diffusion-based recommendation models typically
utilize standard Gaussian noise in symmetric forward and reverse processes in
continuous data space. Nevertheless, the samples derived from recommendation
systems inhabit a discrete data space, which is fundamentally different from
the continuous one. Moreover, Gaussian noise has the potential to corrupt
personalized information within latent representations. In this work, we
propose a novel and effective method, named Asymmetric Diffusion Recommendation
Model (AsymDiffRec), which learns forward and reverse processes in an
asymmetric manner. We define a generalized forward process that simulates the
missing features in real-world recommendation samples. The reverse process is
then performed in an asymmetric latent feature space. To preserve personalized
information within the latent representation, a task-oriented optimization
strategy is introduced. In the serving stage, the raw sample with missing
features is regarded as a noisy input to generate a denoising and robust
representation for the final prediction. By equipping base models with
AsymDiffRec, we conduct online A/B tests, achieving improvements of +0.131% and
+0.166% in terms of users' active days and app usage duration respectively.
Additionally, the extended offline experiments also demonstrate improvements.
AsymDiffRec has been implemented in the Douyin Music App.
Ссылки и действия
Дополнительные ресурсы: