Optimizing Privacy-Preserving Primitives to Support LLM-Scale Applications
2509.25072v1
cs.CR, cs.AI, cs.LG
2025-10-01
Авторы:
Yaman Jandali, Ruisi Zhang, Nojan Sheybani, Farinaz Koushanfar
Резюме на русском
## Контекст
Область privacy-preserving technologies на протяжении многих лет является ключевой темой в компьютерных науках, особенно в связи с возрастающим значением данных и их защиты. Несмотря на прогресс в шифровании и анонимных методах передачи данных, основной проблемой остается высокий компьютерный и сетевой оверхед, который ограничивает практическое применение этих технологий в реальных системах. Это ограничение становится особенно актуальным при работе с большими моделями языка (LLM), требующими больших вычислительных ресурсов и безопасности. Мотивация для этого исследования заключается в создании методов, которые бы уменьшили этот оверхед и позволили использовать LLM-scale приложения в полностью защищенных условиях.
## Метод
Работа основывается на следующих технологиях: multi-party computation (MPC), zero-knowledge proofs (ZKPs) и fully homomorphic encryption (FHE). Архитектура предлагаемого решения основывается на комплексном сочетании этих технологий, чтобы оптимизировать процессы вычислений и снизить нагрузку на систему. Методика включает несколько этапов: разработка оптимизированных алгоритмов, их тестирование на реальных данных, и анализ полученных результатов. Одним из ключевых аспектов является значительное сокращение накладных расходов, получаемое благодаря тщательному сочетанию технических решений и алгоритмов.
## Результаты
В результате экспериментов был продемонстрирован успех в создании методов, позволяющих реализовывать LLM-scale приложения с приемлемым уровнем безопасности и минимальным оверхедом. Для этих целей использовались различные данные, включая данные для обучения моделей языка и данные для тестирования защищенности систем. Было доказано, что система позволяет уменьшить стоимость вычислений, не ухудшая безопасность и качество результатов. Это продемонстрировано в сценариях, таких как защита прав на интеллектуальную собственность, контроль использования моделей языка, и оптимизация интерпретации трансформеров.
## Значимость
Полученные результаты имеют широкие применения в различных областях, включая защиту корпоративных данных, нейронные сети, искусственный интеллект и безопасные вычисления. Особенное преимущество заключается в возможности использования LLM-scale моделей в средах, требующих высокого уровня безопасности и конфиденциальности. Это может привести к улучшению безопасности коммерческих систем, расширению возможностей для разработчиков и пользователей, а также повышению эффективности изобретений в области AI.
## Выводы
Данная работа достигла значительных улучшений в оптимизации privacy-preserving primitives, что открывает путь к практическому применению
Abstract
Privacy-preserving technologies have introduced a paradigm shift that allows
for realizable secure computing in real-world systems. The significant barrier
to the practical adoption of these primitives is the computational and
communication overhead that is incurred when applied at scale. In this paper,
we present an overview of our efforts to bridge the gap between this overhead
and practicality for privacy-preserving learning systems using multi-party
computation (MPC), zero-knowledge proofs (ZKPs), and fully homomorphic
encryption (FHE). Through meticulous hardware/software/algorithm co-design, we
show progress towards enabling LLM-scale applications in privacy-preserving
settings. We demonstrate the efficacy of our solutions in several contexts,
including DNN IP ownership, ethical LLM usage enforcement, and transformer
inference.
Ссылки и действия
Дополнительные ресурсы: