Entity Representation Learning Through Onsite-Offsite Graph for Pinterest Ads

2508.02609v2 cs.LG, cs.AI, cs.SE 2025-08-09
Авторы:

Jiayin Jin, Zhimeng Pan, Yang Tang, Jiarui Feng, Kungang Li, Chongyuan Xiang, Jiacheng Li, Runze Su, Siping Ji, Han Sun, Ling Leng, Prathibha Deshikachar

Резюме на русском

В статье предлагается метод улучшения обучения представлений сущностей для рекламных моделей, ориентированных на оптимизацию CTR и CVR в Pinterest Ads. Основная проблема заключается в том, что существующие модели неэффективно интегрируют знания из графа, состоящего из onsite и offsite активностей пользователей. Разработанное решение включает в себя построение крупномасштабного графа, сочетающего onsite-обращения пользователей в рекламных кампаниях и offsite-конверсии. Для эффективного обработки этого графа предложен TransRA, усовершенствованная модель Knowledge Graph Embedding (KGE), которая активно использует аттестационные механизмы для объединения эмбеддингов в рекомендательную модель. Чтобы повысить пользу от KGE в реальных задачах рекламного ориентированного ранжирования, введены техники Large ID Embedding Table и fine-tuning KGE. Эксперименты показали повышение AUC в CTR и CVR на 2.69% и 1.34% соответственно, а также сокращение CPC. Эти технологии могут быть использованы для улучшения моделей в других индустриальных системах рекомендаций.

Abstract

Graph Neural Networks (GNN) have been extensively applied to industry recommendation systems, as seen in models like GraphSage\cite{GraphSage}, TwHIM\cite{TwHIM}, LiGNN\cite{LiGNN} etc. In these works, graphs were constructed based on users' activities on the platforms, and various graph models were developed to effectively learn node embeddings. In addition to users' onsite activities, their offsite conversions are crucial for Ads models to capture their shopping interest. To better leverage offsite conversion data and explore the connection between onsite and offsite activities, we constructed a large-scale heterogeneous graph based on users' onsite ad interactions and opt-in offsite conversion activities. Furthermore, we introduced TransRA (TransR\cite{TransR} with Anchors), a novel Knowledge Graph Embedding (KGE) model, to more efficiently integrate graph embeddings into Ads ranking models. However, our Ads ranking models initially struggled to directly incorporate Knowledge Graph Embeddings (KGE), and only modest gains were observed during offline experiments. To address this challenge, we employed the Large ID Embedding Table technique and innovated an attention based KGE finetuning approach within the Ads ranking models. As a result, we observed a significant AUC lift in Click-Through Rate (CTR) and Conversion Rate (CVR) prediction models. Moreover, this framework has been deployed in Pinterest's Ads Engagement Model and contributed to $2.69\%$ CTR lift and $1.34\%$ CPC reduction. We believe the techniques presented in this paper can be leveraged by other large-scale industrial models.

Ссылки и действия