zkUnlearner: A Zero-Knowledge Framework for Verifiable Unlearning with Multi-Granularity and Forgery-Resistance

2509.07290v1 cs.CR, cs.AI 2025-09-11
Авторы:

Nan Wang, Nan Wu, Xiangyu Hui, Jiafan Wang, Xin Yuan

Резюме на русском

#### Контекст С ростом спроса на соблюдение права на удаление личных данных (право на "забытьство") возрастает необходимость в верифицируемом машинном "учтеринге". Это означает, что системы должны доказывать, что они удалили конкретные данные, чтобы обеспечить прозрачность и ответственность. Однако существуют значительные сложности в эффективности и безопасности таких процессов. Наша мотивация заключается в разработке системы, которая может доказывать удаление данных на высоком уровне конфиденциальности и защищаться от ложных утверждений о том, что данные были удалены. #### Метод Мы предлагаем **zkUnlearner** — первую систему, основанную на нулевых знаниях (zero-knowledge), для верификации машинного "учтеринга". Она основывается на новой модели вычислений, включающей метод **бит-маскирования**, который позволяет выполнять **селективное удаление** данных — на уровне сэмплов, признаков или классов. Модель может быть переведена в арифметические схемы, что обеспечивает ее поддержку в различных системах нулевых знаний. Мы также предлагаем стратегии для **защиты от прямых фальсификаций**, когда злоумышленники могут подделать данные о том, что удаление произошло, но на самом деле оно не выполнено. Наш подход эффективен и при этом очень безопасный. #### Результаты Мы провели эксперименты с использованием предоставленных данных, в том числе с имитацией различных сценариев удаления данных. Наши результаты показывают, что **zkUnlearner** успешно доказывает удаление данных на разных уровнях гранулярности, включая признаки и классы, без потери производительности. Также мы протестировали систему на **защите от фальсификаций**, показав, что она эффективно отвечает на современные атаки. Эксперименты подтвердили высокую эффективность и практичность нашего подхода. #### Значимость Наш подход может быть применен в сценариях, где требуется высокая безопасность и прозрачность, например, в системах здравоохранения, финансовых услугах и образовательных платформах. **zkUnlearner** обеспечивает не только верификацию удаления данных, но и защиту от ложных утверждений, что делает его важной компонентой для соблюдения законодательства о защите данных. Мы также отмечаем, что наш подход может быть расширен для работы с новыми типами данных и задачами в области машинного обучения. #### Выводы Мы впервые представили **zkUnlearner** — фреймворк, который эффективно решает проблемы верификации удаления данных на разных уровнях гранулярности и защищается от фальсификаций. Наши результаты открывают новые возможности для безопасного и прозрачного машинного "учтеринга". В будущем мы

Abstract

As the demand for exercising the "right to be forgotten" grows, the need for verifiable machine unlearning has become increasingly evident to ensure both transparency and accountability. We present {\em zkUnlearner}, the first zero-knowledge framework for verifiable machine unlearning, specifically designed to support {\em multi-granularity} and {\em forgery-resistance}. First, we propose a general computational model that employs a {\em bit-masking} technique to enable the {\em selectivity} of existing zero-knowledge proofs of training for gradient descent algorithms. This innovation enables not only traditional {\em sample-level} unlearning but also more advanced {\em feature-level} and {\em class-level} unlearning. Our model can be translated to arithmetic circuits, ensuring compatibility with a broad range of zero-knowledge proof systems. Furthermore, our approach overcomes key limitations of existing methods in both efficiency and privacy. Second, forging attacks present a serious threat to the reliability of unlearning. Specifically, in Stochastic Gradient Descent optimization, gradients from unlearned data, or from minibatches containing it, can be forged using alternative data samples or minibatches that exclude it. We propose the first effective strategies to resist state-of-the-art forging attacks. Finally, we benchmark a zkSNARK-based instantiation of our framework and perform comprehensive performance evaluations to validate its practicality.

Ссылки и действия