📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Yutong Li, Yu Zhu, Yichen Qiao, Ziyu Guan, Lv Shao, Tong Liu, Bo Zheng

## Контекст Одна из основных задач промышленных систем рекомендаций — достичь баланса между эффективностью и эффективностью в стадии предварительного ранжирования (pre-ranking). Эффективные модели, такие как Target Attention (TA), обладают высокой мощностью по взаимодействию признаков, но их высокая сложность вычислений делает их неприменимыми для использования в предварительном ранжировании, где требуется максимальная эффективность. Традиционно, в этой стадии применяются простые модели на основе векторного произведения, что приводит к ухудшению качества рекомендаций. Эта проблема является значимой более-менее всеми промышленными системами рекомендаций, которым необходимо обеспечить высокую скорость работы, не ущербив качеству рекомендаций. Целью нашей работы является разработка метода, который сможет эффективно применяться в предварительном ранжировании, сочетая высокую точность с низкой сложностью. ## Метод Мы предлагаем TARQ (Target Attention with Residual Quantization) — новую архитектуру для предварительного ранжирования, которая призвана приблизить модель предварительного ранжирования к Target Attention. Так как TARQ основан на квантовании резидентного признака (residual quantization), он позволяет уменьшить вычислительные затраты, не теряя в качестве. Идея архитектуры заключается в следующем: мы используем компоненты Target Attention в качестве основной модели, но заменяем части ее вычислений на эффективные методы квантования, чтобы оптимизировать производительность. Эта техника позволяет ускорить процесс ранжирования без ущерба для точности рекомендаций. ## Результаты Мы провели ряд экспериментов на больших датасетах, включая реальные данные сервиса Taobao. Наши результаты показывают, что TARQ значительно превосходит традиционные модели в предварительном ранжировании по метрикам качества, таким как AUC (Area Under Curve) и Precision@N. Особенно значительные улучшения были замечены на больших датасетах, где требуется высокая скорость работы. Более того, в рамках больших онлайн-экспериментов A/B-тестирования в системе Taobao мы получили увеличение в рентабельности и удовлетворенности пользователей в результате развертывания TARQ. ## Значимость Предлагаемый метод может быть применен в широком кругу промышленных рекомендательных систем, где необходимо повысить точность рекомендаций при ограниченных вычислительных ресурсах. Одним из основных преимуществ TARQ является его изящное сочетание точности Target Attention с высокой эффективностью, которое позволяет улучшить качество рекомендаций в рамках требований к скорости работы. Мы ожидаем, что этот подход может иметь будущие применения в других областях, где требуется быстрая эффективная модель для ранжирования. ##
Annotation:
The pre-ranking stage in industrial recommendation systems faces a fundamental conflict between efficiency and effectiveness. While powerful models like Target Attention (TA) excel at capturing complex feature interactions in the ranking stage, their high computational cost makes them infeasible for pre-ranking, which often relies on simplistic vector-product models. This disparity creates a significant performance bottleneck for the entire system. To bridge this gap, we propose TARQ, a novel pr...
ID: 2509.16931v2 cs.IR, cs.AI, cs.LG, I.2.0; I.5.0; I.7.0
Авторы:

Yutong Li, Yu Zhu, Yichen Qiao, Ziyu Guan, Lv Shao, Tong Liu, Bo Zheng

#### Контекст Pre-ranking является критическим этапом в индустриальных системах рекомендаций, так как определяет качество дальнейших рекомендаций. Однако существует существенное противоречие между эффективностью и точностью в этой стадии. Точные модели, такие как Target Attention (TA), могут хорошо подстроиться под сложные интерфейсы, но их высокая стоимость вычислений делает их неприменимыми для пре-ранкинга. Это приводит к снижению качества и меньшему значению пользователю. #### Метод TARQ — новая модель пре-ранкинга, основанная на резидентном отображении, которая приближает моделирование к TA. Основная идея заключается в использовании детерминированного генеративного подхода для эмуляции сложного взаимодействия признаков. За счет эффективного вычислительного упрощения и адаптивной архитектуры, TARQ эффективно применяет целевую аттенцию в пре-ранкинге, улучшая точность без значительного увеличения затрат. #### Результаты TARQ был испытан на больших данных системы Taobao. Он прошел не только оффлайн-эксперименты, но и большой скоростью симулируемого пре-ранкинга в онлайне. Результаты показали значительный прирост точности и эффективности, превосходя существующие модели. #### Значимость TARQ может применяться в различных системах рекомендаций, где существует необходимость совмещения точности и скорости. Он позволяет улучшить качество рекомендаций за счет эффективного использования ресурсов. Это ведет к повышению удовлетворенности пользователей и повышению производительности системы в целом. #### Выводы TARQ достигает нового состояния точности и эффективности в пре-ранкинге. Наша модель уже действует в реальности, служит миллионам пользователей и показывает существенный бизнес-прогресс. Будущие исследования будут направлены на углубление понимания и улучшение методологии TARQ.
Annotation:
The pre-ranking stage in industrial recommendation systems faces a fundamental conflict between efficiency and effectiveness. While powerful models like Target Attention (TA) excel at capturing complex feature interactions in the ranking stage, their high computational cost makes them infeasible for pre-ranking, which often relies on simplistic vector-product models. This disparity creates a significant performance bottleneck for the entire system. To bridge this gap, we propose TARQ, a novel pr...
ID: 2509.16931v1 cs.IR, cs.AI, cs.LG, I.2.0; I.5.0; I.7.0