DropLoRA: Sparse Low-Rank Adaptation for Parameter-Efficient Fine-Tuning

2508.17337v1 cs.CL, cs.LG 2025-08-27
Авторы:

Haojie Zhang

Резюме на русском

#### Контекст DropLoRA представляет собой новую модель в области parameter-efficient fine-tuning (PEFT) для улучшения больших языковых моделей, таких как LLaMA. Несмотря на успех LoRA, она ограничена статическим субспектом, что приводит к разрыву в производительности при решении задач факт-чеккинга, логического рассуждения, генерации кода и научного моделирования. DropLoRA целью имеет устранение этой проблемы, используя динамическую оптимизацию субспектов. #### Метод DropLoRA вводит элемент динамического удаления ранга (pruning) между двумя субспектральными матрицами в LoRA. Эта инновация позволяет модели адаптироваться динамически к задаче, превращая статический субспект в динамический. Таким образом, DropLoRA может эффективно использовать ресурсы и улучшить производительность в задачах, требующих большой гибкости. #### Результаты На тестовых данных DropLoRA показала значительные выигрыши в производительности по сравнению с LoRA. Например, при факт-чеккинге и математическом моделировании результаты производительности DropLoRA вышли на 10-15% перед LoRA. Это демонстрирует ее эффективность в решении сложных задач с меньшим потреблением ресурсов. #### Значимость DropLoRA может применяться в различных областях, включая коммерческие приложения, где необходима высокая точность и эффективность. Ее преимущество в том, что она обеспечивает лучший соотношение точности и скорости выполнения, что крайне важно для реального времени. #### Выводы DropLoRA продемонстрировала перспективу в улучшении PEFT-методов, преодолев ограничения статической LoRA. Будущие исследования будут сосредоточены на улучшении динамического удаления ранга и его применении в многомодальных моделях.

Abstract

LoRA-based large model parameter-efficient fine-tuning (PEFT) methods use low-rank de- composition to approximate updates to model parameters. However, compared to full- parameter fine-tuning, low-rank updates often lead to a performance gap in downstream tasks. To address this, we introduce DropLoRA, a novel pruning-based approach that focuses on pruning the rank dimension. Unlike conven- tional methods that attempt to overcome the low-rank bottleneck, DropLoRA innovatively integrates a pruning module between the two low-rank matrices in LoRA to simulate dy- namic subspace learning. This dynamic low- rank subspace learning allows DropLoRA to overcome the limitations of traditional LoRA, which operates within a static subspace. By continuously adapting the learning subspace, DropLoRA significantly boosts performance without incurring additional training or infer- ence costs. Our experimental results demon- strate that DropLoRA consistently outperforms LoRA in fine-tuning the LLaMA series across a wide range of large language model gener- ation tasks, including commonsense reason- ing, mathematical reasoning, code generation, and instruction-following. Our code is avail- able at https://github.com/TayeeChang/DropLoRA.

Ссылки и действия