DP-FedLoRA: Privacy-Enhanced Federated Fine-Tuning for On-Device Large Language Models

2509.09097v1 cs.CR, cs.AI 2025-09-13

Авторы:

Honghui Xu, Shiva Shrestha, Wei Chen, Zhiyuan Li, Zhipeng Cai

Резюме на русском

## Контекст Федеративное обучение моделей языка (Federated Fine-Tuning, FF) становится важной парадигмой для развития настраиваемых моделей языкового понимания на периферийных устройствах. Однако в этой среде обучения существуют значительные проблемы с безопасностью и конфиденциальностью, особенно когда работа производится с пользовательскими данными, которые могут быть утекшими или злоупотребляемыми. Для решения этих проблем необходимо построить концептуально новое подходное решение, которое обеспечит эффективность, безопасность и приватность в федеративном обучении моделей языка. Такое подходное решение может стать ключевым элементом для успешного интегрирования моделей языка в область применений на периферийных устройствах. ## Метод Мы предлагаем DP-FedLoRA, который является новым фреймворком для федеративного обучения моделей языка с добавлением приватности. Основной идеей является использование локального укрупнения градиентов и метода LoRA для модификации локальных моделей. Это позволяет быстро улучшать модели на устройствах, уменьшая влияние централизованного обучения. Мы также используем методы, основанные на дифференциальной приватности, чтобы обеспечить защиту от утечек информации. Таким образом, предлагаемый подход позволяет обучать модели языка на устройствах, сохраняя при этом конфиденциальность пользовательских данных. ## Результаты Мы проводили ряд экспериментов, используя различные бенчмарки, включая текстовые распознавание и генерацию. Результаты показывают, что DP-FedLoRA выдает результаты, которые сопоставимы с традиционным обучением моделей, но с значительно более высокой приватностью. Мы также проводили эксперименты с различным числом клиентов и различными настройками гиперпараметров, подтвердив гибкость и эффективность нашего подхода. Эти результаты показывают, что мы можем построить модели языка, которые имеют высокую производительность и при этом сохраняют конфиденциальность данных пользователей. ## Значимость Предлагаемый подход имеет большое значение для сферы применений в области мобильных устройств, где необходимо быстро и эффективно выполнять вычисления, при этом не нарушая конфиденциальности пользователей. DP-FedLoRA может быть применен в сферах, таких как здравоохранение, финансы и мобильные приложения. Он предоставляет преимущества в виде улучшенной конфиденциальности, более быстрого расчета и эффективности в использовании ресурсов. Этот подход может стать ключевым в широком распространении моделей языка на периферийных устройствах, таких как смартфоны и IoT-устройства. ## Вывод

Abstract

As on-device large language model (LLM) systems become increasingly prevalent, federated fine-tuning enables advanced language understanding and generation directly on edge devices; however, it also involves processing sensitive, user-specific data, raising significant privacy concerns within the federated learning framework. To address these challenges, we propose DP-FedLoRA, a privacy-enhanced federated fine-tuning framework that integrates LoRA-based adaptation with differential privacy in a communication-efficient setting. Each client locally clips and perturbs its LoRA matrices using Gaussian noise to satisfy ($\epsilon$, $\delta$)-differential privacy. We further provide a theoretical analysis demonstrating the unbiased nature of the updates and deriving bounds on the variance introduced by noise, offering practical guidance for privacy-budget calibration. Experimental results across mainstream benchmarks show that DP-FedLoRA delivers competitive performance while offering strong privacy guarantees, paving the way for scalable and privacy-preserving LLM deployment in on-device environments.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

DP-FedLoRA: Privacy-Enhanced Federated Fine-Tuning for On-Device Large Language Models

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

A Light-Weight Large Language Model File Format for Highly-Secure Model Distribu...

SoK: a Comprehensive Causality Analysis Framework for Large Language Model Secur...

Hey GPT-OSS, Looks Like You Got It - Now Walk Me Through It! An Assessment of th...

Context-Aware Hierarchical Learning: A Two-Step Paradigm towards Safer LLMs

Large Language Model based Smart Contract Auditing with LLMBugScanner

Навигация