DP-SPRT: Differentially Private Sequential Probability Ratio Tests
2508.06377v1
stat.ML, cs.CR, cs.LG, math.ST, stat.TH
2025-08-12
Авторы:
Thomas Michel, Debabrota Basu, Emilie Kaufmann
Резюме на русском
## Контекст
Исследование ориентировано на развитие методов для секвенциальных тестов двух простых гипотез в условиях защиты частных данных. Добавление конфиденциальности в последовательные алгоритмы тестирования представляет вызов из-за того, что сохранение частности данных может привести к снижению точности и эффективности. Большая часть существующей работы рассматривает только статические аппроксимации тестов, не учитывая момент принятия решения. В этой работе авторы фокусируются на пересмотре классического подхода Walda Sequential Probability Ratio Test (SPRT) для последовательного тестирования двух гипотез с применением концепций конфиденциальности. Целью является разработка алгоритма, который может быть приближено оптимальным образом настроен для соответствия заданной конфиденциальности и ошибкам типа I и II.
## Метод
Авторы предлагают DP-SPRT, слой, который может настраиваться для достижения желаемых ошибок типа I и II и уровней конфиденциальности. Этот метод основывается на механизме OutsideInterval, который определяет конец теста, когда результаты последовательных запросов выходят за пределы заданного интервала. Механизм OutsideInterval улучшает надёжность по сравнению с более простыми методами, такими как AboveThreshold. Алгоритм DP-SPRT принимает последовательность запросов, обрабатывает их с использованием OutsideInterval, и принимает решение о принятии решения о гипотезе на основе этих запросов. Данный подход позволяет повысить точность и эффективность в сравнении с другими приближёнными методами.
## Результаты
В работе приведены универсальные верхние оценки на ошибки и сложность выборки DP-SPRT, которые могут применяться в различных ситуациях, в зависимости от требований к конфиденциальности. Эксперименты проводились с двумя различными типами шума – Laplace (применение чистого Дифференциального Защищённого Алгоритма) и Гауссовский (применение Rényi Differential Privacy). В первом случае показано, что DP-SPRT приближенно оптимален при малых значениях ошибок типа I и II и близких гипотезах. Во втором случае демонстрируется надежность и эффективность DP-SPRT в условиях Rényi Differential Privacy. Также проводился экспериментальный анализ, подтвердив хорошую практическую эффективность алгоритма.
## Значимость
DP-SPRT может быть использован в области прикладной статистики, тестирования гипотез и анализа данных, где необходима конфиденциальность. Основные преимущества заключаются в улучшении точности и эффективности по сравнению с другими приближёнными методами, а также в гибкости настройки для различных задач. Этот подход может иметь значительное влияние на области, где применение тестов на основе последовательности является ключевым, таких как ме
Abstract
We revisit Wald's celebrated Sequential Probability Ratio Test for sequential
tests of two simple hypotheses, under privacy constraints. We propose DP-SPRT,
a wrapper that can be calibrated to achieve desired error probabilities and
privacy constraints, addressing a significant gap in previous work. DP-SPRT
relies on a private mechanism that processes a sequence of queries and stops
after privately determining when the query results fall outside a predefined
interval. This OutsideInterval mechanism improves upon naive composition of
existing techniques like AboveThreshold, potentially benefiting other
sequential algorithms. We prove generic upper bounds on the error and sample
complexity of DP-SPRT that can accommodate various noise distributions based on
the practitioner's privacy needs. We exemplify them in two settings: Laplace
noise (pure Differential Privacy) and Gaussian noise (R\'enyi differential
privacy). In the former setting, by providing a lower bound on the sample
complexity of any $\epsilon$-DP test with prescribed type I and type II errors,
we show that DP-SPRT is near optimal when both errors are small and the two
hypotheses are close. Moreover, we conduct an experimental study revealing its
good practical performance.