ICM-Fusion: In-Context Meta-Optimized LoRA Fusion for Multi-Task Adaptation

2508.04153v1 cs.CV 2025-08-09

Авторы:

Yihua Shao, Xiaofeng Lin, Xinwei Long, Siyu Chen, Minxi Yan, Yang Liu, Ziyang Yan, Ao Ma, Hao Tang, Jingcai Guo

Резюме на русском

Многозадачная адаптация в предварительно обученных моделях Low-Rank Adaptation (LoRA) является ключевым фактором повышения их гибкости. Однако существующие методы фузирования LoRA часто сталкиваются с проблемами, такими как конфликты между весами и катастрофическая забытость доменов. Даже инкрементальное обучение, предназначенное для адаптации к нескольким задачам, способно сгенерировать универсальные модели, но не всегда обеспечивает достаточную общеучительность в сценариях с небольшим количеством примеров. Мы предлагаем In-Context Meta LoRA Fusion (ICM-Fusion), новую фреймворковую модель, которая объединяет мета-обучение с ин-контекстной адаптацией. Её основной инновацией является техника векторного арифметики задач, которая адаптивно корректирует проекции в мантии задач, устраняя конфликты весов. Таким образом, ICM-Fusion позволяет оптимизировать подходящую ориентацию для суперпозиции задач в пространстве весов. Затем, используя Fusion VAE (F-VAE), LoRA-модель может быть генерирована с многозадачной структурой. Наши эксперименты показали, что ICM-Fusion не только существенно уменьшает многозадачный лосс, но и демонстрирует улучшение по производительности в сценарии с небольшим количеством примеров.

Abstract

Enabling multi-task adaptation in pre-trained Low-Rank Adaptation (LoRA) models is crucial for enhancing their generalization capabilities. Most existing pre-trained LoRA fusion methods decompose weight matrices, sharing similar parameters while merging divergent ones. However, this paradigm inevitably induces inter-weight conflicts and leads to catastrophic domain forgetting. While incremental learning enables adaptation to multiple tasks, it struggles to achieve generalization in few-shot scenarios. Consequently, when the weight data follows a long-tailed distribution, it can lead to forgetting in the fused weights. To address this issue, we propose In-Context Meta LoRA Fusion (ICM-Fusion), a novel framework that synergizes meta-learning with in-context adaptation. The key innovation lies in our task vector arithmetic, which dynamically balances conflicting optimization directions across domains through learned manifold projections. ICM-Fusion obtains the optimal task vector orientation for the fused model in the latent space by adjusting the orientation of the task vectors. Subsequently, the fused LoRA is reconstructed by a self-designed Fusion VAE (F-VAE) to realize multi-task LoRA generation. We have conducted extensive experiments on visual and linguistic tasks, and the experimental results demonstrate that ICM-Fusion can be adapted to a wide range of architectural models and applied to various tasks. Compared to the current pre-trained LoRA fusion method, ICM-Fusion fused LoRA can significantly reduce the multi-tasking loss and can even achieve task enhancement in few-shot scenarios.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

ICM-Fusion: In-Context Meta-Optimized LoRA Fusion for Multi-Task Adaptation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

ViRectify: A Challenging Benchmark for Video Reasoning Correction with Multimoda...

PaCo-RL: Advancing Reinforcement Learning for Consistent Image Generation with P...

ViDiC: Video Difference Captioning

Beyond the Ground Truth: Enhanced Supervision for Image Restoration

TempR1: Improving Temporal Understanding of MLLMs via Temporal-Aware Multi-Task ...

Навигация