ICM-Fusion: In-Context Meta-Optimized LoRA Fusion for Multi-Task Adaptation
2508.04153v1
cs.CV
2025-08-09
Авторы:
Yihua Shao, Xiaofeng Lin, Xinwei Long, Siyu Chen, Minxi Yan, Yang Liu, Ziyang Yan, Ao Ma, Hao Tang, Jingcai Guo
Резюме на русском
Многозадачная адаптация в предварительно обученных моделях Low-Rank Adaptation (LoRA) является ключевым фактором повышения их гибкости. Однако существующие методы фузирования LoRA часто сталкиваются с проблемами, такими как конфликты между весами и катастрофическая забытость доменов. Даже инкрементальное обучение, предназначенное для адаптации к нескольким задачам, способно сгенерировать универсальные модели, но не всегда обеспечивает достаточную общеучительность в сценариях с небольшим количеством примеров. Мы предлагаем In-Context Meta LoRA Fusion (ICM-Fusion), новую фреймворковую модель, которая объединяет мета-обучение с ин-контекстной адаптацией. Её основной инновацией является техника векторного арифметики задач, которая адаптивно корректирует проекции в мантии задач, устраняя конфликты весов. Таким образом, ICM-Fusion позволяет оптимизировать подходящую ориентацию для суперпозиции задач в пространстве весов. Затем, используя Fusion VAE (F-VAE), LoRA-модель может быть генерирована с многозадачной структурой. Наши эксперименты показали, что ICM-Fusion не только существенно уменьшает многозадачный лосс, но и демонстрирует улучшение по производительности в сценарии с небольшим количеством примеров.
Abstract
Enabling multi-task adaptation in pre-trained Low-Rank Adaptation (LoRA)
models is crucial for enhancing their generalization capabilities. Most
existing pre-trained LoRA fusion methods decompose weight matrices, sharing
similar parameters while merging divergent ones. However, this paradigm
inevitably induces inter-weight conflicts and leads to catastrophic domain
forgetting. While incremental learning enables adaptation to multiple tasks, it
struggles to achieve generalization in few-shot scenarios. Consequently, when
the weight data follows a long-tailed distribution, it can lead to forgetting
in the fused weights. To address this issue, we propose In-Context Meta LoRA
Fusion (ICM-Fusion), a novel framework that synergizes meta-learning with
in-context adaptation. The key innovation lies in our task vector arithmetic,
which dynamically balances conflicting optimization directions across domains
through learned manifold projections. ICM-Fusion obtains the optimal task
vector orientation for the fused model in the latent space by adjusting the
orientation of the task vectors. Subsequently, the fused LoRA is reconstructed
by a self-designed Fusion VAE (F-VAE) to realize multi-task LoRA generation. We
have conducted extensive experiments on visual and linguistic tasks, and the
experimental results demonstrate that ICM-Fusion can be adapted to a wide range
of architectural models and applied to various tasks. Compared to the current
pre-trained LoRA fusion method, ICM-Fusion fused LoRA can significantly reduce
the multi-tasking loss and can even achieve task enhancement in few-shot
scenarios.
Ссылки и действия
Дополнительные ресурсы: