VFLAIR-LLM: A Comprehensive Framework and Benchmark for Split Learning of LLMs
2508.03097v1
cs.CR, cs.AI, I.2.11
2025-08-09
Авторы:
Zixuan Gu, Qiufeng Fan, Long Sun, Yang Liu, Xiaojun Ye
Резюме на русском
**Резюме**
С ростом популярности Large Language Models (LLMs) возникают новые вызовы, связанные с защитой приватности данных и эффективной интеграцией моделей в ресурс-контролируемые среды. Например, приватные LLM-услуги требуют высоких вычислительных мощностей, а доступ к общедоступным LLM-API ограничивается строгими требованиями по конфиденциальности. Разделенное обучение (Split Learning, SL) предлагает решение, доступное для различных доменов, включая приватные.
Мы предлагаем VFLAIR-LLM, гибкий и эффективный фреймворк для SL, позволяющий запускать LLM-модели в защищенном режиме и дообучать их в ресурс-ограниченных условиях. Наша работа включает два режима разделения модели, поддержку трех типов задач и 18 датасетов, а также модули для оценки атак и защит. Мы проводим бенчмарк 5 атак и 9 защитных стратегий в различных SL-LLM-конфигурациях и даем рекомендации по оптимизации параметров и выбору модели, чтобы обеспечить эффективное применение SL-LLM в реальных сценариях.
Abstract
With the advancement of Large Language Models (LLMs), LLM applications have
expanded into a growing number of fields. However, users with data privacy
concerns face limitations in directly utilizing LLM APIs, while private
deployments incur significant computational demands. This creates a substantial
challenge in achieving secure LLM adaptation under constrained local resources.
To address this issue, collaborative learning methods, such as Split Learning
(SL), offer a resource-efficient and privacy-preserving solution for adapting
LLMs to private domains. In this study, we introduce VFLAIR-LLM (available at
https://github.com/FLAIR-THU/VFLAIR-LLM), an extensible and lightweight split
learning framework for LLMs, enabling privacy-preserving LLM inference and
fine-tuning in resource-constrained environments. Our library provides two LLM
partition settings, supporting three task types and 18 datasets. In addition,
we provide standard modules for implementing and evaluating attacks and
defenses. We benchmark 5 attacks and 9 defenses under various Split Learning
for LLM(SL-LLM) settings, offering concrete insights and recommendations on the
choice of model partition configurations, defense strategies, and relevant
hyperparameters for real-world applications.
Ссылки и действия
Дополнительные ресурсы: