Normalized Square Root: Sharper Matrix Factorization Bounds for Differentially Private Continual Counting
2509.14334v1
cs.DS, cs.CR, cs.LG
2025-09-20
Авторы:
Monika Henzinger, Nikita P. Kalinin, Jalaj Upadhyay
Резюме на русском
#### Контекст
В области разностной приватности (differential privacy), нормированные квадратные корни являются ключевыми критериями для оценки точности различных методов, таких как применение глубоких нейронных сетей. Одним из важных вопросов является достижение точности при работе с глубокими моделями, где требуется минимизировать ошибки в процессе обучения на больших данных. Одна из самых проблемных задач в этой области — повышение точности различных алгоритмов обучения, которые позволяют поддерживать приватность данных, немедленно обрабатывая большие объемы данных в реальном времени. Несмотря на развитие многих методов, таких как градиентный способ и метод градиентного исключения, значительными ограничениями являются сложность и неточность вычислений в режиме реального времени. Наше исследование посвящено улучшению теоретических базисов, необходимых для точного определения факторизации матриц в рамках приватных алгоритмов.
#### Метод
Мы применяем новую математическую модель, основываясь на теории графов и матричных разложений, для построения более точных оценок \(\gamma_2(M_{count})\) и \(\gamma_F(M_{count})\), где \(M_{count}\) — нижнетреугольная матрица с единичными элементами. Методом геометрического анализа мы исследуем связи между этими факторами и применяем новые алгоритмы для уменьшения разницы между нижними и верхними оценками. Это достигается за счет использования частных свойств матрицы \(M_{count}\) и использования новых математических трансформаций.
#### Результаты
Мы показали, что $$
0.701 + \frac{\log n}{\pi} + o(1) \leq \gamma_2(M_{count}) \leq 0.846 + \frac{\log n}{\pi} + o(1).
$$ Это позволило сократить разницу между верхней и нижней оценками до $0.14 + o(1)$. Также, для \(\gamma_F(M_{count})\) достигнуты следующие оценки: $$
0.701 + \frac{\log n}{\pi} + o(1) \leq \gamma_F(M_{count}) \leq 0.748 + \frac{\log n}{\pi} + o(1).
$$ Эти результаты позволяют существенно уменьшить разрыв между теоретическими оценками для \(\gamma_2\) и \(\gamma_F\), улучшив точность различных моделей, использующих различные методы приватности.
#### Значимость
Наша работа имеет прикладное значение для улучшения различных методов обучения глубоких моделей, где требуется обработка больших данных в режиме реального времени. Уменьшение разницы между верхними и нижними оценками позволяет повысить точность работы глубоких моделей при применении различных приватных методов. Это также может быть применено к различным задачам данных большого размера, таким как сегментация изображений, обработка естественного языка и анализ биоинформатики. Наша работа также открывает пути для дальнейшего исследования
Abstract
The factorization norms of the lower-triangular all-ones $n \times n$ matrix,
$\gamma_2(M_{count})$ and $\gamma_{F}(M_{count})$, play a central role in
differential privacy as they are used to give theoretical justification of the
accuracy of the only known production-level private training algorithm of deep
neural networks by Google. Prior to this work, the best known upper bound on
$\gamma_2(M_{count})$ was $1 + \frac{\log n}{\pi}$ by Mathias (Linear Algebra
and Applications, 1993), and the best known lower bound was $\frac{1}{\pi}(2 +
\log(\frac{2n+1}{3})) \approx 0.507 + \frac{\log n}{\pi}$ (Matou\v{s}ek,
Nikolov, Talwar, IMRN 2020), where $\log$ denotes the natural logarithm.
Recently, Henzinger and Upadhyay (SODA 2025) gave the first explicit
factorization that meets the bound of Mathias (1993) and asked whether there
exists an explicit factorization that improves on Mathias' bound. We answer
this question in the affirmative. Additionally, we improve the lower bound
significantly. More specifically, we show that $$
0.701 + \frac{\log n}{\pi} + o(1) \;\leq\; \gamma_2(M_{count}) \;\leq\; 0.846
+ \frac{\log n}{\pi} + o(1). $$ That is, we reduce the gap between the upper
and lower bound to $0.14 + o(1)$.
We also show that our factors achieve a better upper bound for
$\gamma_{F}(M_{count})$ compared to prior work, and we establish an improved
lower bound: $$
0.701 + \frac{\log n}{\pi} + o(1) \;\leq\; \gamma_{F}(M_{count}) \;\leq\;
0.748 + \frac{\log n}{\pi} + o(1). $$ That is, the gap between the lower and
upper bound provided by our explicit factorization is $0.047 + o(1)$.
Ссылки и действия
Дополнительные ресурсы: