OnePiece: Bringing Context Engineering and Reasoning to Industrial Cascade Ranking System
2509.18091v1
cs.IR, cs.AI, cs.CL
2025-09-24
Авторы:
Sunhao Dai, Jiakai Tang, Jiahua Wu, Kun Wang, Yuxuan Zhu, Bingjun Chen, Bangyang Hong, Yu Zhao, Cong Fu, Kangle Wu, Yabo Ni, Anxiang Zeng, Wenjie Wang, Xu Chen, Jun Xu, See-Kiong Ng
Резюме на русском
## Контекст
В последние годы становится все более очевидным, что технологии глубокого обучения постепенно трансформируют индустрии, в том числе системы поиска и рекомендаций. Однако, несмотря на всплеск интереса к широкому применению трансформерных архитектур, преимущества, которые они приносят, часто остаются ограниченными. Это можно объяснить тем, что большинство индустриальных систем продолжают опираться на Deep Learning Recommendation Models (DLRMs), ограничиваясь их модификациями. В то же время значительные преимущества, которые приносят технологии, такие как глубокий ранжирований (LLMs), возникают не только из-за изобретений в архитектуре, но и благодаря таким механизмам, как контекстное обогащение и многошаговая логика. Эти механизмы, однако, в рамках индустриальных систем ранжирования, до сих пор остаются недостаточно исследованными.
## Метод
OnePiece представляет собой новую архитектуру, которая успешно интегрирует механизмы контекстного обогащения и многошагового рефинемента в ранжирование и поиск в составе индустриальных пайплайнов. Эта модель основывается на трансформерной структуре, но имеет уникальные особенности: (1) **Структурированное контекстное обогащение**, прикрепляющее к входным сигналам как интересы пользователя, так и контекстные признаки сценариев, представленные в виде входных токенов; (2) **Блочное логическое обогащение**, которое вводит итеративные шаги рефинемента представлений, возможность которых растет вместе с размером блока; (3) **Прогрессивное мульти-задачное обучение**, которое строится на цепочках пользовательских фидбеков, позволяя контролировать процесс обучения при развитии модели.
## Результаты
Для оценки модели OnePiece проводились различные эксперименты на реальных данных. Мы использовали большие наборы данных из индустриальных систем поиска и рекомендаций. Методами анализа метрик, таких как GMV/UU и доходы из рекламы, были получены очевидные показатели улучшения. Например, исследования показали, что OnePiece добавила до $+2\%$ GMV/UU и $+2.90\%$ в доходы от рекламы. Эти результаты подтверждают, что OnePiece не только улучшает ранжирование, но и увеличивает эффективность системы в целом.
## Значимость
Помимо основного применения в системах поиска и рекомендаций, OnePiece может быть распространена в различных индустрияльных сценариях, таких как моделирование поведения покупателей, улучшение рекомендаций в контексте транзакционных систем. Основным преимуществом OnePiece является её способность улучшить качество рекомендаций в целостных индустриальных пайплайнах, что способствует повышению пользовательского привлечения и эффекти
Abstract
Despite the growing interest in replicating the scaled success of large
language models (LLMs) in industrial search and recommender systems, most
existing industrial efforts remain limited to transplanting Transformer
architectures, which bring only incremental improvements over strong Deep
Learning Recommendation Models (DLRMs). From a first principle perspective, the
breakthroughs of LLMs stem not only from their architectures but also from two
complementary mechanisms: context engineering, which enriches raw input queries
with contextual cues to better elicit model capabilities, and multi-step
reasoning, which iteratively refines model outputs through intermediate
reasoning paths. However, these two mechanisms and their potential to unlock
substantial improvements remain largely underexplored in industrial ranking
systems.
In this paper, we propose OnePiece, a unified framework that seamlessly
integrates LLM-style context engineering and reasoning into both retrieval and
ranking models of industrial cascaded pipelines. OnePiece is built on a pure
Transformer backbone and further introduces three key innovations: (1)
structured context engineering, which augments interaction history with
preference and scenario signals and unifies them into a structured tokenized
input sequence for both retrieval and ranking; (2) block-wise latent reasoning,
which equips the model with multi-step refinement of representations and scales
reasoning bandwidth via block size; (3) progressive multi-task training, which
leverages user feedback chains to effectively supervise reasoning steps during
training. OnePiece has been deployed in the main personalized search scenario
of Shopee and achieves consistent online gains across different key business
metrics, including over $+2\%$ GMV/UU and a $+2.90\%$ increase in advertising
revenue.
Ссылки и действия
Дополнительные ресурсы: