Evading Overlapping Community Detection via Proxy Node Injection

2509.21211v1 cs.SI, cs.AI, I.2.6; I.2.8; G.2.2; I.5.1 2025-09-27
Авторы:

Dario Loi, Matteo Silvestri, Fabrizio Silvestri, Gabriele Tolomei

Резюме на русском

## Контекст В современных социальных сетях и других сетевых приложениях широко распространена проблема защиты личной информации, особенно в отношении групп взаимодействия пользователей. Защита такой информации в графах связей крайне важна, так как вредоносные акторы могут использовать анализ графов для получения конфиденциальных данных, таких как принадлежность пользователей к определенным группам. Однако, многие существующие подходы к защите принадлежности к сообществам (community membership hiding, или CMH) ориентированы на необходимость изменения графа без каких-либо потерь в структуре. Это проблема особенно актуальна в случае сложных социальных сетей с пересекающимися сообществами (overlapping communities), где методы линейного поиска или простых модификаций не приводят к эффективным результатам. Мы стремимся к разработке нового подхода, основывающегося на машинном обучении, который может эффективно решать задачу CMH в таких сложных сетевых сценариях. ## Метод Для решения проблемы CMH в сетях с пересекающимися сообществами мы предлагаем использовать глубокое учебное ренифорсментное обучение (deep reinforcement learning, DRL). Целью DRL является научить агента выбирать эффективные манипуляции с ребрами графа, чтобы вынудить целевой узел покинуть свою оригинальную группу. В нашей модели вводится понятие **proxy nodes** (посредников), которые имитируют действия пользователей, внося изменения в структуру графа, необходимые для подрыва принадлежности к сообществу. Метод использует алгоритмы DRL для обучения политик модификации графа, используя тренировочные данные, а также для оптимизации локальных модификаций, чтобы минимизировать влияние на остальную часть графа. Это позволяет гарантировать, что изменения будут наиболее эффективными и незаметными. ## Результаты Мы провели эксперименты на пяти реальных датасетах с пересекающимися сообществами, используя существующие алгоритмы для сравнения. Наши результаты показывают, что наш подход, основанный на DRL, эффективно решает задачу CMH в сложных сетевых сценариях. Мы сравнили результаты с двумя основными подходами: линейным поиском и алгоритмом на основе градиентов. Наши результаты показали, что DRL-подход не только приводит к более эффективной защите принадлежности к группе, но и значительно эффективнее в терминах скорости выполнения. Наши модификации графа являются менее видимыми и подавляют информацию о принадлежности к сообществу более эффективно, чем другие методы. ## Значимость Метод, основанный на DRL, обладает значительным потенциалом для применения в области защиты личной информации в социаль

Abstract

Protecting privacy in social graphs requires preventing sensitive information, such as community affiliations, from being inferred by graph analysis, without substantially altering the graph topology. We address this through the problem of \emph{community membership hiding} (CMH), which seeks edge modifications that cause a target node to exit its original community, regardless of the detection algorithm employed. Prior work has focused on non-overlapping community detection, where trivial strategies often suffice, but real-world graphs are better modeled by overlapping communities, where such strategies fail. To the best of our knowledge, we are the first to formalize and address CMH in this setting. In this work, we propose a deep reinforcement learning (DRL) approach that learns effective modification policies, including the use of proxy nodes, while preserving graph structure. Experiments on real-world datasets show that our method significantly outperforms existing baselines in both effectiveness and efficiency, offering a principled tool for privacy-preserving graph modification with overlapping communities.

Ссылки и действия