DropLoRA: Sparse Low-Rank Adaptation for Parameter-Efficient Fine-Tuning
2508.17337v1
cs.CL, cs.LG
2025-08-27
Авторы:
Haojie Zhang
Резюме на русском
#### Контекст
DropLoRA представляет собой новую модель в области parameter-efficient fine-tuning (PEFT) для улучшения больших языковых моделей, таких как LLaMA. Несмотря на успех LoRA, она ограничена статическим субспектом, что приводит к разрыву в производительности при решении задач факт-чеккинга, логического рассуждения, генерации кода и научного моделирования. DropLoRA целью имеет устранение этой проблемы, используя динамическую оптимизацию субспектов.
#### Метод
DropLoRA вводит элемент динамического удаления ранга (pruning) между двумя субспектральными матрицами в LoRA. Эта инновация позволяет модели адаптироваться динамически к задаче, превращая статический субспект в динамический. Таким образом, DropLoRA может эффективно использовать ресурсы и улучшить производительность в задачах, требующих большой гибкости.
#### Результаты
На тестовых данных DropLoRA показала значительные выигрыши в производительности по сравнению с LoRA. Например, при факт-чеккинге и математическом моделировании результаты производительности DropLoRA вышли на 10-15% перед LoRA. Это демонстрирует ее эффективность в решении сложных задач с меньшим потреблением ресурсов.
#### Значимость
DropLoRA может применяться в различных областях, включая коммерческие приложения, где необходима высокая точность и эффективность. Ее преимущество в том, что она обеспечивает лучший соотношение точности и скорости выполнения, что крайне важно для реального времени.
#### Выводы
DropLoRA продемонстрировала перспективу в улучшении PEFT-методов, преодолев ограничения статической LoRA. Будущие исследования будут сосредоточены на улучшении динамического удаления ранга и его применении в многомодальных моделях.
Abstract
LoRA-based large model parameter-efficient fine-tuning (PEFT) methods use
low-rank de- composition to approximate updates to model parameters. However,
compared to full- parameter fine-tuning, low-rank updates often lead to a
performance gap in downstream tasks. To address this, we introduce DropLoRA, a
novel pruning-based approach that focuses on pruning the rank dimension. Unlike
conven- tional methods that attempt to overcome the low-rank bottleneck,
DropLoRA innovatively integrates a pruning module between the two low-rank
matrices in LoRA to simulate dy- namic subspace learning. This dynamic low-
rank subspace learning allows DropLoRA to overcome the limitations of
traditional LoRA, which operates within a static subspace. By continuously
adapting the learning subspace, DropLoRA significantly boosts performance
without incurring additional training or infer- ence costs. Our experimental
results demon- strate that DropLoRA consistently outperforms LoRA in
fine-tuning the LLaMA series across a wide range of large language model gener-
ation tasks, including commonsense reason- ing, mathematical reasoning, code
generation, and instruction-following. Our code is avail- able at
https://github.com/TayeeChang/DropLoRA.
Ссылки и действия
Дополнительные ресурсы: