CSRM-LLM: Embracing Multilingual LLMs for Cold-Start Relevance Matching in Emerging E-commerce Markets

2509.01566v1 cs.IR, cs.CL 2025-09-05
Авторы:

Yujing Wang, Yiren Chen, Huoran Li, Chunxu Xu, Yuchong Luo, Xianghui Mao, Cong Li, Lun Du, Chunyang Ma, Qiqi Jiang, Yin Wang, Fan Gao, Wenting Mo, Pei Wen, Shantanu Kumar, Taejin Park, Yiwei Song, Vijay Rajaram, Tao Cheng, Sonu Durgia, Pranam Kolari

Резюме на русском

## Контекст Проблема cold-start в релевантном соответствии — одна из наиболее трудных задач в розничной торговле, особенно в новых или экзотических рынках. Это происходит из-за отсутствия достаточного объема данных о пользовательских поведениях и оценочных метках. Из-за этого поисковые системы имеют трудности в том, чтобы предоставить пользователям наиболее актуальные и релевантные товары. Это влияет на пользовательский опыт и, в итоге, на финансовую эффективность. Наша цель — создать эффективное решение для устранения этой проблемы в отрасли электронной коммерции. ## Метод Мы предлагаем **CSRM-LLM**, который использует многоязычные Large Language Model (LLM) для решения проблемы cold-start в ситуациях, когда имеется ограниченная информация о пользователях и их поведении. Наш подход включает три основных компонента: 1. **Cross-lingual transfer learning** — мы обучаем модель на основе перевода запросов и описаний товаров с помощью машинного перевода, что позволяет модели работать с несколькими языками. 2. **Query augmentation through retrieval** — мы обогащаем запросы, используя релевантные товары из базы данных, чтобы улучшить понимание пользовательских запросов и увеличить релевантность рекомендаций. 3. **Multi-round self-distillation training** — это стратегия обучения, которая уменьшает влияние ошибочных меток обучения и улучшает точность модели. ## Результаты Мы проводили эксперименты на реальных данных, полученных в рамках работы нашей компании Coupang. Мы сравнивали CSRM-LLM с имеющимися решениями на базе LLM и показали, что наш подход позволяет снизить **defect ratio** (ошибочных рекомендаций) на **45.8%** и увеличить **session purchase rate** (сессионную скорость покупок) на **0.866%**. Это свидетельствует о том, что наше решение эффективно решает проблемы cold-start в сложных многоязычных средах электронной коммерции. ## Значимость CSRM-LLM имеет большое потенциал в многоязычных и международных средах электронной коммерции. Он может быть применен для улучшения cold-start релевантности в различных сценариях, таких как локализация товарных предложений, улучшение поиска и маркетинга. Это решение имеет также значительный потенциал для дальнейшего расширения в область машинного обучения и искусственного интеллекта. ## Выводы Мы успешно разработали CSRM-LLM, эффективное решение для устранения проблемы cold-start в релевантном соответствии в многоязычных средах электронной коммерции. Этот подход доказал свою эффективность в реальных условиях и существенно улучшил показатели качества. В будущем мы планируем расширить данный подход, включив дополнительные модели и методы, чтобы улучшить его работу в условиях отсутствия данных.

Abstract

As global e-commerce platforms continue to expand, companies are entering new markets where they encounter cold-start challenges due to limited human labels and user behaviors. In this paper, we share our experiences in Coupang to provide a competitive cold-start performance of relevance matching for emerging e-commerce markets. Specifically, we present a Cold-Start Relevance Matching (CSRM) framework, utilizing a multilingual Large Language Model (LLM) to address three challenges: (1) activating cross-lingual transfer learning abilities of LLMs through machine translation tasks; (2) enhancing query understanding and incorporating e-commerce knowledge by retrieval-based query augmentation; (3) mitigating the impact of training label errors through a multi-round self-distillation training strategy. Our experiments demonstrate the effectiveness of CSRM-LLM and the proposed techniques, resulting in successful real-world deployment and significant online gains, with a 45.8% reduction in defect ratio and a 0.866% uplift in session purchase rate.

Ссылки и действия