DPQuant: Efficient and Differentially-Private Model Training via Dynamic Quantization Scheduling
2509.03472v1
cs.LG, cs.AI, cs.DC
2025-09-05
Авторы:
Yubo Gao, Renbo Tu, Gennady Pekhimenko, Nandita Vijaykumar
Резюме на русском
## Контекст
Differentially-Private Stochastic Gradient Descent (DP-SGD) является важной методикой для защиты конфиденциальности при обучении нейронных сетей с использованием чувствительных данных. Однако обучение с помощью DP-SGD чревато высокими затратами на вычисления и энергией. Для устранения этой проблемы широко распространенным решением является использование низкопрецизионного представления моделей, включая веса и активации. Эта техника, называемая quantization, позволяет значительно сократить время обучения, энергопотребление и затраты. Однако, при обучении DP-SGD, внедрение шума, характерное для этого подхода, сильно усиливает вариацию, вызванную низкопрецизионным представлением, что приводит к более существенной ухудшению точности модели. Мы рассматриваем эту проблему, а также предлагаем решение, которое позволяет сочетать эффективность и чувствительность к приватности в обучении моделей.
## Метод
Мы предлагаем QPQuant, динамическую систему адаптивной quantization-схемы, которая адаптирует состав выбранных для quantization слоев на каждой эпохе обучения. Наш подход основывается на двух основных компонентах: (i) вероятностная семуляция, позволяющая каждой эпохе поворачивать, какие слои будут quantized, и (ii) loss-aware layer prioritization, которая использует применение частично дифференциальной конфиденциальности (DP) для оценки сенситивности весов каждого слоя. Оценка сенситивности потребляет незначительную часть общего бюджета конфиденциальности, сохраняя при этом гарантии защиты приватности. Эта стратегия позволяет адаптироваться к характеристикам модели и данных, сводя к минимуму ущерб от quantization к модели.
## Результаты
Мы проводим эксперименты с QPQuant на топовых моделях, таких как ResNet18, ResNet50, и DenseNet121, используя наборы данных ImageNet, CIFAR-10 и CIFAR-100. Наши результаты показывают, что QPQuant обеспечивает более высокую точность по сравнению с статическими схемами quantization, сохраняя при этом высокую эффективность. Мы получаем до 2.21x увеличения пропускной способности на низкопрецизионном железе, с менее чем 2% ухудшением точности на валидации. Эти результаты демонстрируют значительные преимущества QPQuant перед существующими методами, которые не так эффективно решают проблему влияния quantization на DP-SGD.
## Значимость
Наш подход имеет широкие применения в области защиты приватности при обучении моделей, особенно в сценариях, где высокая точность и эффективность критичны. Это включает такие области, как здравоохранение, финансы и юридические системы, где обеспечение конфиденциальности и высокая производительность являются ключевыми. Эффективность QPQuant позволяет сократить затраты на обучение и
Abstract
Differentially-Private SGD (DP-SGD) is a powerful technique to protect user
privacy when using sensitive data to train neural networks. During training,
converting model weights and activations into low-precision formats, i.e.,
quantization, can drastically reduce training times, energy consumption, and
cost, and is thus a widely used technique. In this work, we demonstrate that
quantization causes significantly higher accuracy degradation in DP-SGD
compared to regular SGD. We observe that this is caused by noise injection in
DP-SGD, which amplifies quantization variance, leading to disproportionately
large accuracy degradation. To address this challenge, we present QPQuant, a
dynamic quantization framework that adaptively selects a changing subset of
layers to quantize at each epoch. Our method combines two key ideas that
effectively reduce quantization variance: (i) probabilistic sampling of the
layers that rotates which layers are quantized every epoch, and (ii) loss-aware
layer prioritization, which uses a differentially private loss sensitivity
estimator to identify layers that can be quantized with minimal impact on model
quality. This estimator consumes a negligible fraction of the overall privacy
budget, preserving DP guarantees. Empirical evaluations on ResNet18, ResNet50,
and DenseNet121 across a range of datasets demonstrate that DPQuant
consistently outperforms static quantization baselines, achieving near
Pareto-optimal accuracy-compute trade-offs and up to 2.21x theoretical
throughput improvements on low-precision hardware, with less than 2% drop in
validation accuracy.
Ссылки и действия
Дополнительные ресурсы: