Normalized Square Root: Sharper Matrix Factorization Bounds for Differentially Private Continual Counting

2509.14334v1 cs.DS, cs.CR, cs.LG 2025-09-20
Авторы:

Monika Henzinger, Nikita P. Kalinin, Jalaj Upadhyay

Резюме на русском

#### Контекст В области разностной приватности (differential privacy), нормированные квадратные корни являются ключевыми критериями для оценки точности различных методов, таких как применение глубоких нейронных сетей. Одним из важных вопросов является достижение точности при работе с глубокими моделями, где требуется минимизировать ошибки в процессе обучения на больших данных. Одна из самых проблемных задач в этой области — повышение точности различных алгоритмов обучения, которые позволяют поддерживать приватность данных, немедленно обрабатывая большие объемы данных в реальном времени. Несмотря на развитие многих методов, таких как градиентный способ и метод градиентного исключения, значительными ограничениями являются сложность и неточность вычислений в режиме реального времени. Наше исследование посвящено улучшению теоретических базисов, необходимых для точного определения факторизации матриц в рамках приватных алгоритмов. #### Метод Мы применяем новую математическую модель, основываясь на теории графов и матричных разложений, для построения более точных оценок \(\gamma_2(M_{count})\) и \(\gamma_F(M_{count})\), где \(M_{count}\) — нижнетреугольная матрица с единичными элементами. Методом геометрического анализа мы исследуем связи между этими факторами и применяем новые алгоритмы для уменьшения разницы между нижними и верхними оценками. Это достигается за счет использования частных свойств матрицы \(M_{count}\) и использования новых математических трансформаций. #### Результаты Мы показали, что $$ 0.701 + \frac{\log n}{\pi} + o(1) \leq \gamma_2(M_{count}) \leq 0.846 + \frac{\log n}{\pi} + o(1). $$ Это позволило сократить разницу между верхней и нижней оценками до $0.14 + o(1)$. Также, для \(\gamma_F(M_{count})\) достигнуты следующие оценки: $$ 0.701 + \frac{\log n}{\pi} + o(1) \leq \gamma_F(M_{count}) \leq 0.748 + \frac{\log n}{\pi} + o(1). $$ Эти результаты позволяют существенно уменьшить разрыв между теоретическими оценками для \(\gamma_2\) и \(\gamma_F\), улучшив точность различных моделей, использующих различные методы приватности. #### Значимость Наша работа имеет прикладное значение для улучшения различных методов обучения глубоких моделей, где требуется обработка больших данных в режиме реального времени. Уменьшение разницы между верхними и нижними оценками позволяет повысить точность работы глубоких моделей при применении различных приватных методов. Это также может быть применено к различным задачам данных большого размера, таким как сегментация изображений, обработка естественного языка и анализ биоинформатики. Наша работа также открывает пути для дальнейшего исследования

Abstract

The factorization norms of the lower-triangular all-ones $n \times n$ matrix, $\gamma_2(M_{count})$ and $\gamma_{F}(M_{count})$, play a central role in differential privacy as they are used to give theoretical justification of the accuracy of the only known production-level private training algorithm of deep neural networks by Google. Prior to this work, the best known upper bound on $\gamma_2(M_{count})$ was $1 + \frac{\log n}{\pi}$ by Mathias (Linear Algebra and Applications, 1993), and the best known lower bound was $\frac{1}{\pi}(2 + \log(\frac{2n+1}{3})) \approx 0.507 + \frac{\log n}{\pi}$ (Matou\v{s}ek, Nikolov, Talwar, IMRN 2020), where $\log$ denotes the natural logarithm. Recently, Henzinger and Upadhyay (SODA 2025) gave the first explicit factorization that meets the bound of Mathias (1993) and asked whether there exists an explicit factorization that improves on Mathias' bound. We answer this question in the affirmative. Additionally, we improve the lower bound significantly. More specifically, we show that $$ 0.701 + \frac{\log n}{\pi} + o(1) \;\leq\; \gamma_2(M_{count}) \;\leq\; 0.846 + \frac{\log n}{\pi} + o(1). $$ That is, we reduce the gap between the upper and lower bound to $0.14 + o(1)$. We also show that our factors achieve a better upper bound for $\gamma_{F}(M_{count})$ compared to prior work, and we establish an improved lower bound: $$ 0.701 + \frac{\log n}{\pi} + o(1) \;\leq\; \gamma_{F}(M_{count}) \;\leq\; 0.748 + \frac{\log n}{\pi} + o(1). $$ That is, the gap between the lower and upper bound provided by our explicit factorization is $0.047 + o(1)$.

Ссылки и действия