ZORRO: Zero-Knowledge Robustness and Privacy for Split Learning (Full Version)

2509.09787v1 cs.CR, cs.AI 2025-09-16

Авторы:

Nojan Sheybani, Alessandro Pegoraro, Jonathan Knauer, Phillip Rieger, Elissa Mollakuqe, Farinaz Koushanfar, Ahmad-Reza Sadeghi

Резюме на русском

#### Контекст Split Learning (SL) — это распределенный метод обучения, который позволяет ресурсо-ограниченным клиентам совместно обучать модели глубоких нейронных сетей (DNN), передавая на сервер большую часть слоев, а оставшуюся часть (входные и выходные слои) оставляя на клиентском устройстве. Этот подход позволяет использовать вычислительные мощности сервера без разглашения данных, что делает SL особенно эффективным в средах с ограниченными ресурсами, где данные являются секретными. Однако распределенная природа SL делает его уязвимым перед атаками клиентов, которые могут инжектировать токсичные intermediate gradients, что приводит к внедрению backdoors в общую модель. Дефензы SL, существующие на сегодняшний день, ограничиваются внутренним защитой сервера и не гарантируют безопасности клиентов. #### Метод Мы предлагаем ZORRO — Zero-Knowledge Robustness and Privacy для Split Learning. ZORRO является частично централизованной системой, в которой клиенты обучают модели с использованием zero-knowledge proofs (ZKPs) для того, чтобы доказать интегритность своего локального обучения. ZORRO включает в себя новоструктурированный подход к решению проблемы токсичности intermediate gradients. Мы визуализируем intermediate results с помощью градиентной представления в фазовой сфере и применяем технологии ZKPs для верификации того, что обновленный локальный модельный чекпойнт является безопасным и не содержит backdoors. #### Результаты Мы провести ряд экспериментов, включая различные модели, такие как ResNet, и различные атаки, такие как backdoor и poisoning. В результате, ZORRO существенно снижает успешность атак, до 6%, при этом быстродействие теряется всего на 10 секунд для моделей с миллионом параметров. Это показывает, что ZORRO эффективно обеспечивает безопасность клиентов, не приводя к существенному замедлению тренировки. #### Значимость ZORRO может быть применено в ситуациях, где клиенты не доверяют друг другу, но все же нуждаются в обучении моделей вместе. Он привносит новый уровень прозрачности в обучение, доказывая безопасность и интегритность клиентских моделей. ZORRO широко применим в таких областях, как секретное обучение, медицинские изображения, и другие секретные задачи, где защита данных ключевая. #### Выводы ZORRO доказывает, что можно обеспечить безопасность и интегритность в распределенном обучении без дополнительного грузинга сервера. Дальнейшие исследования будут ориентированы на улучшение ZKPs для более сложных моделей и расширение ZORRO для ситуаций, когда клиенты имеют разные модели.

Abstract

Split Learning (SL) is a distributed learning approach that enables resource-constrained clients to collaboratively train deep neural networks (DNNs) by offloading most layers to a central server while keeping in- and output layers on the client-side. This setup enables SL to leverage server computation capacities without sharing data, making it highly effective in resource-constrained environments dealing with sensitive data. However, the distributed nature enables malicious clients to manipulate the training process. By sending poisoned intermediate gradients, they can inject backdoors into the shared DNN. Existing defenses are limited by often focusing on server-side protection and introducing additional overhead for the server. A significant challenge for client-side defenses is enforcing malicious clients to correctly execute the defense algorithm. We present ZORRO, a private, verifiable, and robust SL defense scheme. Through our novel design and application of interactive zero-knowledge proofs (ZKPs), clients prove their correct execution of a client-located defense algorithm, resulting in proofs of computational integrity attesting to the benign nature of locally trained DNN portions. Leveraging the frequency representation of model partitions enables ZORRO to conduct an in-depth inspection of the locally trained models in an untrusted environment, ensuring that each client forwards a benign checkpoint to its succeeding client. In our extensive evaluation, covering different model architectures as well as various attack strategies and data scenarios, we show ZORRO's effectiveness, as it reduces the attack success rate to less than 6\% while causing even for models storing \numprint{1000000} parameters on the client-side an overhead of less than 10 seconds.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

ZORRO: Zero-Knowledge Robustness and Privacy for Split Learning (Full Version)

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

A Light-Weight Large Language Model File Format for Highly-Secure Model Distribu...

SoK: a Comprehensive Causality Analysis Framework for Large Language Model Secur...

Hey GPT-OSS, Looks Like You Got It - Now Walk Me Through It! An Assessment of th...

Context-Aware Hierarchical Learning: A Two-Step Paradigm towards Safer LLMs

Large Language Model based Smart Contract Auditing with LLMBugScanner

Навигация