A Scenario-Oriented Survey of Federated Recommender Systems: Techniques, Challenges, and Future Directions

2508.19620v1 cs.IR, cs.AI, cs.CR 2025-08-29
Авторы:

Yunqi Mi, Jiakui Shen, Guoshuai Zhao, Jialie Shen, Xueming Qian

Резюме на русском

## Контекст Рекомендательные системы (RecSys) — одна из наиболее популярных категорий моделей машинного обучения, используемых для поиска и сопоставления пользователями с полезным информационным контентом. Однако существуют серьезные проблемы в обеспечении приватности и защиты данных в таких системах. Федеративное обучение (FL), в свою очередь, предлагает решение для этих проблем, позволяя обучать модели на распределенных данных, не передавая их на сервер. Особенно актуальным является FL в рекомендательных системах (FedRec), где данные хранятся на клиентских устройствах, например, мобильных устройствах. Централизованные рекомендательные системы (CenRec) собирают и обучают модели на сервере, что приводит к возможности утечки данных. Федеративные рекомендательные системы (FedRec), напротив, обучают модели на клиентских устройствах, позволяя серверу только объединять модели и данные, чтобы избежать утечки персональной информации. Это сделало FedRec востребованным в различных приложениях, но при этом возникли новые вызовы, такие как статистическая неоднородность данных и проблемы агрегации моделей. Этот обзор фокусируется на анализе технической стороны FedRec, его проблемах и возможных решениях в различных рекомендательных сценариях. ## Метод В этом обзоре мы используем сценарий-ориентированную модель, чтобы разобраться в уникальных характеристиках рекомендательных систем, чтобы понять, как FedRec может быть применен в различных сценариях. Мы разделили FedRec на несколько ключевых сценариев, таких как: **cross-domain FedRec**, **cross-app FedRec**, **cross-platform FedRec**, и **cross-user FedRec**. Для каждого сценария мы проанализировали технические проблемы, которые возникают в нём, и предложили решения. Например, в случае cross-domain FedRec, мы обратили внимание на проблему label drift, где различные платформы имеют разные распределения меток, что приводит к статистической неоднородности. Мы также проанализировали техники, такие как **model-agnostic knowledge distillation**, **federated transfer learning** и **federated meta-learning**, которые могут быть использованы для решения этих проблем. Мы также разработали модель, которая связывает FedRec с различными сценариями и показывает, как можно применить FedRec в реальной жизни. ## Результаты Мы провели эксперименты в нескольких сценариях FedRec, используя различные данные и методы. Например, в сценарии cross-domain FedRec, мы использовали данные от различных платформ, таких как e-commerce и video streaming, и проанализировали, как label drift влияет на качество рекомендаций. Мы также протестировали наши решения на реальных данных, включая данные от Amazon и YouTube. Мы использовали метрики, такие как **precision@k**, **recall@k** и **NDCG**, для оценки качества рекомендаций. Наши результаты показали, что FedRec может подстроиться под различные сценарии и им

Abstract

Extending recommender systems to federated learning (FL) frameworks to protect the privacy of users or platforms while making recommendations has recently gained widespread attention in academia. This is due to the natural coupling of recommender systems and federated learning architectures: the data originates from distributed clients (mostly mobile devices held by users), which are highly related to privacy. In a centralized recommender system (CenRec), the central server collects clients' data, trains the model, and provides the service. Whereas in federated recommender systems (FedRec), the step of data collecting is omitted, and the step of model training is offloaded to each client. The server only aggregates the model and other knowledge, thus avoiding client privacy leakage. Some surveys of federated recommender systems discuss and analyze related work from the perspective of designing FL systems. However, their utility drops by ignoring specific recommendation scenarios' unique characteristics and practical challenges. For example, the statistical heterogeneity issue in cross-domain FedRec originates from the label drift of the data held by different platforms, which is mainly caused by the recommender itself, but not the federated architecture. Therefore, it should focus more on solving specific problems in real-world recommendation scenarios to encourage the deployment FedRec. To this end, this review comprehensively analyzes the coupling of recommender systems and federated learning from the perspective of recommendation researchers and practitioners. We establish a clear link between recommendation scenarios and FL frameworks, systematically analyzing scenario-specific approaches, practical challenges, and potential opportunities. We aim to develop guidance for the real-world deployment of FedRec, bridging the gap between existing research and applications.

Ссылки и действия

Связанные статьи

Membership Inference Attacks on Recommender System: A Survey

## Контекст **Анализ рекомендательных систем** (Recommender Systems, RecSys) и **членские осуществительные атаки** (Memb...

2025-09-17