DP-SPRT: Differentially Private Sequential Probability Ratio Tests

2508.06377v1 stat.ML, cs.CR, cs.LG, math.ST, stat.TH 2025-08-12
Авторы:

Thomas Michel, Debabrota Basu, Emilie Kaufmann

Резюме на русском

## Контекст Исследование ориентировано на развитие методов для секвенциальных тестов двух простых гипотез в условиях защиты частных данных. Добавление конфиденциальности в последовательные алгоритмы тестирования представляет вызов из-за того, что сохранение частности данных может привести к снижению точности и эффективности. Большая часть существующей работы рассматривает только статические аппроксимации тестов, не учитывая момент принятия решения. В этой работе авторы фокусируются на пересмотре классического подхода Walda Sequential Probability Ratio Test (SPRT) для последовательного тестирования двух гипотез с применением концепций конфиденциальности. Целью является разработка алгоритма, который может быть приближено оптимальным образом настроен для соответствия заданной конфиденциальности и ошибкам типа I и II. ## Метод Авторы предлагают DP-SPRT, слой, который может настраиваться для достижения желаемых ошибок типа I и II и уровней конфиденциальности. Этот метод основывается на механизме OutsideInterval, который определяет конец теста, когда результаты последовательных запросов выходят за пределы заданного интервала. Механизм OutsideInterval улучшает надёжность по сравнению с более простыми методами, такими как AboveThreshold. Алгоритм DP-SPRT принимает последовательность запросов, обрабатывает их с использованием OutsideInterval, и принимает решение о принятии решения о гипотезе на основе этих запросов. Данный подход позволяет повысить точность и эффективность в сравнении с другими приближёнными методами. ## Результаты В работе приведены универсальные верхние оценки на ошибки и сложность выборки DP-SPRT, которые могут применяться в различных ситуациях, в зависимости от требований к конфиденциальности. Эксперименты проводились с двумя различными типами шума – Laplace (применение чистого Дифференциального Защищённого Алгоритма) и Гауссовский (применение Rényi Differential Privacy). В первом случае показано, что DP-SPRT приближенно оптимален при малых значениях ошибок типа I и II и близких гипотезах. Во втором случае демонстрируется надежность и эффективность DP-SPRT в условиях Rényi Differential Privacy. Также проводился экспериментальный анализ, подтвердив хорошую практическую эффективность алгоритма. ## Значимость DP-SPRT может быть использован в области прикладной статистики, тестирования гипотез и анализа данных, где необходима конфиденциальность. Основные преимущества заключаются в улучшении точности и эффективности по сравнению с другими приближёнными методами, а также в гибкости настройки для различных задач. Этот подход может иметь значительное влияние на области, где применение тестов на основе последовательности является ключевым, таких как ме

Abstract

We revisit Wald's celebrated Sequential Probability Ratio Test for sequential tests of two simple hypotheses, under privacy constraints. We propose DP-SPRT, a wrapper that can be calibrated to achieve desired error probabilities and privacy constraints, addressing a significant gap in previous work. DP-SPRT relies on a private mechanism that processes a sequence of queries and stops after privately determining when the query results fall outside a predefined interval. This OutsideInterval mechanism improves upon naive composition of existing techniques like AboveThreshold, potentially benefiting other sequential algorithms. We prove generic upper bounds on the error and sample complexity of DP-SPRT that can accommodate various noise distributions based on the practitioner's privacy needs. We exemplify them in two settings: Laplace noise (pure Differential Privacy) and Gaussian noise (R\'enyi differential privacy). In the former setting, by providing a lower bound on the sample complexity of any $\epsilon$-DP test with prescribed type I and type II errors, we show that DP-SPRT is near optimal when both errors are small and the two hypotheses are close. Moreover, we conduct an experimental study revealing its good practical performance.

Ссылки и действия