Stabilization of Perturbed Loss Function: Differential Privacy without Gradient Noise

2508.15523v1 cs.LG, cs.IT, math.IT 2025-08-23
Авторы:

Salman Habib, Remi Chou, Taejoon Kim

Резюме на русском

################################# ## Контекст ################################# Изучение методов обучения моделей с применением дифференциальной частной сохранности (Differential Privacy, DP) является ключевым в сфере машинного обучения в условиях защиты конфиденциальности данных. Одним из широко распространенных подходов является **Differentially Private Stochastic Gradient Descent (DP-SGD)**, который добавляет шум к градиентам лосса функции во время обучения. Однако данный подход имеет значительные ограничения: шумность градиентов приводит к ухудшению качества модели и требует значительных вычислительных ресурсов. Другим важным аспектом является поддержка многопользовательских сред, где каждый пользователь должен обеспечивать защиту своих данных. Направлением исследования является создание методов, которые обеспечивают эффективность, устойчивость и защиту конфиденциальности в таких средах. ################################# ## Метод ################################# Рассматривается метод **Stabilization of Perturbed Loss Function (SPOF)**, предназначенный для обучения моделей в многопользовательских средах с использованием **локальной дифференциальной частности (Local Differential Privacy, LDP)**. SPOF использует полиномиальную аппроксимацию тренировочного функционала потерь, потенциально сужающуюся до полинома 2-го порядка. Шум, добавляемый для обеспечения LDP, распределяется по коэффициентам этого полинома. Эта модель отличается от DP-SGD тем, что не требует добавления шума к градиентам, что упрощает вычисления и повышает стабильность. Метод SPOF также обладает робастностью к искажениям входных данных и корректирует зависимость от чувствительности к условиям окружения, таких как шум от биологических сенсоров в Wireless Body Area Network (WBAN). ################################# ## Результаты ################################# В ходе экспериментов SPOF был подвергнут сравнению с многопользовательской версией DP-SGD в ситуации с множеством пользователей, имеющих различные типы данных и подвержденным шумам сенсоров в WBAN. Результаты показали, что SPOF демонстрирует более высокую точность реконструкции модели (до 3.5% в сравнении с DP-SGD) и значительно сокращает время обучения — до 57.2%. Это указывает на более эффективный баланс между защитой конфиденциальности и качеством обучения. Отмечено, что SPOF лучше справляется с шумом входных данных и характеризуется более точной аппроксимацией функции потерь. ################################# ## Значимость ################################# SPOF показывает свою применимость в сценариях многопользовательского обучения, где необходима эффективная защита конфиденциальности (LDP) и высокая модельная точность. Его преимущества заключаются в улучшенном балансе между защитой конфиденциальности и качеством обучения, низких вычислительными затратами и устойчивости к внешним помехам. Данный по

Abstract

We propose SPOF (Stabilization of Perturbed Loss Function), a differentially private training mechanism intended for multi-user local differential privacy (LDP). SPOF perturbs a stabilized Taylor expanded polynomial approximation of a model's training loss function, where each user's data is privatized by calibrated noise added to the coefficients of the polynomial. Unlike gradient-based mechanisms such as differentially private stochastic gradient descent (DP-SGD), SPOF does not require injecting noise into the gradients of the loss function, which improves both computational efficiency and stability. This formulation naturally supports simultaneous privacy guarantees across all users. Moreover, SPOF exhibits robustness to environmental noise during training, maintaining stable performance even when user inputs are corrupted. We compare SPOF with a multi-user extension of DP-SGD, evaluating both methods in a wireless body area network (WBAN) scenario involving heterogeneous user data and stochastic channel noise from body sensors. Our results show that SPOF achieves, on average, up to 3.5% higher reconstruction accuracy and reduces mean training time by up to 57.2% compared to DP-SGD, demonstrating superior privacy-utility trade-offs in multi-user environments.

Ссылки и действия