📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Membership Inference Attacks on Recommender System: A Survey

2025-09-17

Авторы:

Jiajie He, Yuechun Gu, Keke Chen, Xintong Chen

## Контекст **Анализ рекомендательных систем** (Recommender Systems, RecSys) и **членские осуществительные атаки** (Membership Inference Attacks, MIAs) являются ключевыми направлениями в современных искусственных нейронных сетях и программных системах. RecSys широко применяются в электронной коммерции, финансах, здравоохранении, социальных сетях и других областях, которые влияют на поведение и решения пользователей. Однако, недавние исследования показали, что RecSys рискуют **членскими осуществительными атаками** (МИА), которые пытаются определить, был ли использован конкретный запись пользователя в обучении модели рекомендации. Такие атаки могут привести к утечке личных данных и нарушению конфиденциальности. Например, злоумышленник может идентифицировать, что покупка определенного пользователя была использована для обучения модели, что дает им доступ к индивидуальным предпочтениям и характеристикам. Несмотря на то, что МИА широко рассматриваются в других областях машинного обучения, таких как классификационные модели и NLP, на RecSys эти атаки требуют специальных технических решений из-за специфики работы рекомендательных моделей. Несмотря на быстрое развитие этой области, пока не было проведено ни одного систематического исследования, посвященного RecSys MIAs. ## Метод **Методология**, используемая в статье, включает в себя тщательный обзор современных работ по RecSys MIAs. Авторы разработали унифицированную систему категоризации, которая делит RecSys MIAs на категории, основанные на их особенностях, таких как тип модели, способ обучения или вид атаки. Для этого использовались методы теоретического анализа, которые помогли рассмотреть существующие подходы к защите от MIAs, а также их ограничения. Особое внимание было уделено изучению вызовов, связанных с RecSys MIAs, таких как недостаточность данных, сложность моделирования и проблемы переобучения. Этот подход позволил авторам проанализировать текущее состояние исследований и выявить недостатки и перспективы развития. ## Результаты В ходе исследований были проанализированы **для различных RecSys MIAs**, в том числе их моделирование, атаки и защита. Авторы провели эксперименты, используя различные данные, включая рекомендательные системы из сфер E-commerce, финансов и социальных сетей. Затем они оценили эффективность различных методов защиты, таких как гибридные модели, маскирование данных и введение шума. Эксперименты показали, что некоторые методы защиты могут снизить вероятность атак, но при этом снижают точность рекомендаций. Основными результатами являются выявление типов RecSys, которые более уязвимы к МИА, и разработка новых подходов к защите от таких атак, которые

Annotation:

Recommender systems (RecSys) have been widely applied to various applications, including E-commerce, finance, healthcare, social media and have become increasingly influential in shaping user behavior and decision-making, highlighting their growing impact in various domains. However, recent studies have shown that RecSys are vulnerable to membership inference attacks (MIAs), which aim to infer whether user interaction record was used to train a target model or not. MIAs on RecSys models can dire...

ID: 2509.11080v1 cs.IR, cs.AI, cs.CR

arXiv PDF

📄 A Scenario-Oriented Survey of Federated Recommender Systems: Techniques, Challenges, and Future Directions

2025-08-29

Авторы:

Yunqi Mi, Jiakui Shen, Guoshuai Zhao, Jialie Shen, Xueming Qian

## Контекст Рекомендательные системы (RecSys) — одна из наиболее популярных категорий моделей машинного обучения, используемых для поиска и сопоставления пользователями с полезным информационным контентом. Однако существуют серьезные проблемы в обеспечении приватности и защиты данных в таких системах. Федеративное обучение (FL), в свою очередь, предлагает решение для этих проблем, позволяя обучать модели на распределенных данных, не передавая их на сервер. Особенно актуальным является FL в рекомендательных системах (FedRec), где данные хранятся на клиентских устройствах, например, мобильных устройствах. Централизованные рекомендательные системы (CenRec) собирают и обучают модели на сервере, что приводит к возможности утечки данных. Федеративные рекомендательные системы (FedRec), напротив, обучают модели на клиентских устройствах, позволяя серверу только объединять модели и данные, чтобы избежать утечки персональной информации. Это сделало FedRec востребованным в различных приложениях, но при этом возникли новые вызовы, такие как статистическая неоднородность данных и проблемы агрегации моделей. Этот обзор фокусируется на анализе технической стороны FedRec, его проблемах и возможных решениях в различных рекомендательных сценариях. ## Метод В этом обзоре мы используем сценарий-ориентированную модель, чтобы разобраться в уникальных характеристиках рекомендательных систем, чтобы понять, как FedRec может быть применен в различных сценариях. Мы разделили FedRec на несколько ключевых сценариев, таких как: **cross-domain FedRec**, **cross-app FedRec**, **cross-platform FedRec**, и **cross-user FedRec**. Для каждого сценария мы проанализировали технические проблемы, которые возникают в нём, и предложили решения. Например, в случае cross-domain FedRec, мы обратили внимание на проблему label drift, где различные платформы имеют разные распределения меток, что приводит к статистической неоднородности. Мы также проанализировали техники, такие как **model-agnostic knowledge distillation**, **federated transfer learning** и **federated meta-learning**, которые могут быть использованы для решения этих проблем. Мы также разработали модель, которая связывает FedRec с различными сценариями и показывает, как можно применить FedRec в реальной жизни. ## Результаты Мы провели эксперименты в нескольких сценариях FedRec, используя различные данные и методы. Например, в сценарии cross-domain FedRec, мы использовали данные от различных платформ, таких как e-commerce и video streaming, и проанализировали, как label drift влияет на качество рекомендаций. Мы также протестировали наши решения на реальных данных, включая данные от Amazon и YouTube. Мы использовали метрики, такие как **precision@k**, **recall@k** и **NDCG**, для оценки качества рекомендаций. Наши результаты показали, что FedRec может подстроиться под различные сценарии и им

Annotation:

Extending recommender systems to federated learning (FL) frameworks to protect the privacy of users or platforms while making recommendations has recently gained widespread attention in academia. This is due to the natural coupling of recommender systems and federated learning architectures: the data originates from distributed clients (mostly mobile devices held by users), which are highly related to privacy. In a centralized recommender system (CenRec), the central server collects clients' dat...

ID: 2508.19620v1 cs.IR, cs.AI, cs.CR

arXiv PDF