Deciphering the Interplay between Attack and Protection Complexity in Privacy-Preserving Federated Learning

2508.11907v1 cs.CR, cs.AI 2025-08-19
Авторы:

Xiaojin Zhang, Mingcong Xu, Yiming Li, Wei Chen, Qiang Yang

Резюме на русском

## Контекст Federated learning (FL) является обещающим подходом для обучения моделей с помощью данных, распределенных между независимыми узлами, при этом сохраняя приватность данных. Однако FL подвержен атакам, таким как gradient inversion, которые могут раскрыть приватные данные участников. Эти атаки требуют сложных вычислений и больших объемов данных для эффективной реализации. Необходимо разработать теоретические модели, позволяющие лучше понять этот баланс между сложностью атаки и защиты. Такие модели помогут в создании более безопасных и эффективных систем FL. ## Метод Мы предлагаем новую теоретическую модель для оценки сложности атак и защит в FL. Определяется "Attack Complexity" (сложность атаки) как минимальные ресурсы, необходимые для того, чтобы атакующий мог восстановить приватные данные с определенной точностью. Также определяется "Protection Complexity" (сложность защиты) как среднее расстояние до данных, добавляемое за счет защитных механизмов. Используя модель Maximum Bayesian Privacy (MBP), мы получаем теоретические ограничения для этих показателей, которые зависят от модели, приватности и других факторов. ## Результаты Мы провели эксперименты на различных моделях и данных, оценив сложность атак и защиты в различных условиях. Наши результаты показали, что сложность атаки и защиты зависит от модели, используемых данных и уровня приватности. Например, мы обнаружили, что сложность атаки увеличивается с увеличением модели и уменьшением уровня приватности. Эти результаты подтверждают наши теоретические выводы и демонстрируют тонкую зависимость между сложностью атак и защиты. ## Значимость Мы показываем, что наша модель может быть применена в различных сценариях FL, включая банковскую систему, медицинскую индустрию и транспортную систему. Наши результаты помогают лучше понять торговуюoffs между приватностью, эффективностью и устойчивостью FL-систем. Это открывает путь к разработке более безопасных и эффективных методов FL, которые могут быть использованы в реальном мире. ## Выводы Мы представили новую теоретическую модель для изучения взаимодействия между сложностью атак и защиты в FL. Наши результаты демонстрируют, что сложность атак и защиты зависит от модели, данных и уровня приватности. Наша работа открывает новые возможности для дальнейшего исследования в области безопасного FL. Мы планируем расширить нашу модель, включив более сложные атаки и защитные механизмы.

Abstract

Federated learning (FL) offers a promising paradigm for collaborative model training while preserving data privacy. However, its susceptibility to gradient inversion attacks poses a significant challenge, necessitating robust privacy protection mechanisms. This paper introduces a novel theoretical framework to decipher the intricate interplay between attack and protection complexities in privacy-preserving FL. We formally define "Attack Complexity" as the minimum computational and data resources an adversary requires to reconstruct private data below a given error threshold, and "Protection Complexity" as the expected distortion introduced by privacy mechanisms. Leveraging Maximum Bayesian Privacy (MBP), we derive tight theoretical bounds for protection complexity, demonstrating its scaling with model dimensionality and privacy budget. Furthermore, we establish comprehensive bounds for attack complexity, revealing its dependence on privacy leakage, gradient distortion, model dimension, and the chosen privacy level. Our findings quantitatively illuminate the fundamental trade-offs between privacy guarantees, system utility, and the effort required for both attacking and defending. This framework provides critical insights for designing more secure and efficient federated learning systems.

Ссылки и действия