TASO: Task-Aligned Sparse Optimization for Parameter-Efficient Model Adaptation

2509.17688v1 cs.CL, cs.CV 2025-09-24

Авторы:

Daiye Miao, Yufang Liu, Jie Wang, Changzhi Sun, Yunke Zhang, Demei Yan, Shaokang Dong, Qi Zhang, Yuanbin Wu

Резюме на русском

#### Контекст Параметр-эффективная методика гибернации моделей (fine-tuning), такая как LoRA, получила широкую популярность благодаря простоте и эффективности. Однако многие исследования отмечают, что LoRA обычно вводит значительный параметрический избыток, что увеличивает размер модели и препятствует эффективному обучению. Удаление этих избыточных параметров является сложной задачей, поскольку идентификация избыточных элементов в LoRA требует точного анализа. Мы предлагаем TASO, метод, основанный на информации о весах предобученной модели, для уменьшения параметрического избытока в LoRA. #### Метод TASO использует важность параметров, определяемую на основе весов предобученной модели, для выявления областей, которые имеют сильнейшее влияние на целевую задачу. Эти области делятся на "ключевые" и "неключевые", а затем используются для определения структуры LoRA-модулей. Это позволяет уменьшить число необходимых параметров до того, как начать fine-tuning. Метод TASO предлагает новую точку зрения на уменьшение избыточности в LoRA, адаптируясь к задаче. #### Результаты Мы проверили TASO на нескольких задачах, включая обработку естественного языка и задачи классификации изображений. Наши эксперименты показали, что TASO постоянно превосходит стандартную LoRA в плане точности работы, даже при использовании одного и того же параметрического бюджета. Например, в задаче обработки естественного языка, TASO с $r = 1$ показал значительное улучшение в сравнении со стандартной LoRA. Эти результаты доказывают, что TASO эффективно уменьшает избыточность в LoRA без потери качества. #### Значимость TASO может применяться в различных областях, где необходима эффективная модель, например, для обработки естественного языка, классификации изображений и других задач, требующих ресурсоемких моделей. Он обеспечивает снижение требуемого числа параметров, уменьшая накладные расходы на обучение и развертывание моделей. Это может привести к более удобным и экономичным решениям в промышленных внедрениях. #### Выводы TASO доказывает, что можно значительно уменьшить избыточность в LoRA, используя информацию о весах предобученной модели. Это приводит к уменьшению числа параметров, необходимых для fine-tuning, при этом сохраняя качество работы модели. Будущие исследования будут направлены на расширение TASO для других параметр-эффективных методов гибернации и улучшение его эффективности на более сложных задачах.

Abstract

LoRA has become one of the most widely used parameter-efficient fine-tuning methods due to its simplicity and effectiveness. However, numerous studies have shown that LoRA often introduces substantial parameter redundancy, which not only increases the number of trainable parameters but also hinders the effectiveness of fine-tuning. Since identifying redundant parameters in LoRA is inherently difficult, how to eliminate them efficiently and accurately remains a challenging problem. In this paper, we propose TASO, a redundancy reduction method that leverages importance information from the pretrained model's weights to mitigate LoRA redundancy. Specifically, we estimate parameter importance on downstream tasks and identify task-specific core regions based on the distribution of importance scores. The location information of these core regions is then used to determine the sparse structure of LoRA modules, enabling redundancy removal before fine-tuning. Our approach significantly reduces the number of trainable parameters required for task adaptation, while providing a novel task-aligned perspective for LoRA redundancy reduction. Experimental results demonstrate that, with a parameter budget comparable to LoRA with rank $r = 1$, TASO consistently outperforms standard LoRA across multiple tasks, achieving strong fine-tuning performance while effectively eliminating redundant parameters.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

TASO: Task-Aligned Sparse Optimization for Parameter-Efficient Model Adaptation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Visual Puns from Idioms: An Iterative LLM-T2IM-MLLM Framework

Optimizing Multimodal Language Models through Attention-based Interpretability

Bangla Sign Language Translation: Dataset Creation Challenges, Benchmarking and ...

Do Vision-Language Models Understand Visual Persuasiveness?

Arctic-Extract Technical Report

Навигация