SEQR: Secure and Efficient QR-based LoRA Routing

2509.18093v1 cs.CL, cs.AI, cs.LG 2025-09-24
Авторы:

William Fleshman, Benjamin Van Durme

Резюме на русском

## Контекст Появление Low-Rank Adaptation (LoRA) превратилось в стандартный подход для эффективного подготовки к работе больших языковых моделей с помощью низкоранжевых адаптеров. Этот подход позволяет создавать большие библиотеки LoRA, каждый из которых нацелен на конкретную задачу или домен. Однако эффективное выбор адаптера для заданного входных данных остается проблемой, особенно в защищенных средах, где настройка рутеров на основе супервизированного обучения может вызывать проблемы в области конфиденциальности. Ранее предложенные подходы, основывающиеся на принципах самостоятельного обучения и активации нормы, предполагали лишь решение частичных задач, не удовлетворяя полностью требованиям по гибкости и безопасности в широком круге применений. Мы рассмотрим новый подход, основывающийся на теоретической модели, которая обеспечивает безопасность и эффективность в работе с LoRA. ## Метод Мы предлагаем SEQR, алгоритм самостоятельного выбора адаптеров LoRA, который оптимизирует выбор путем активации нормы. Наша методология основывается на теореме о максимальной норме, которая позволяет проверить идею, что норма активации может быть использована для выбора наиболее подходящего адаптера. Мы применяем эту теорию для формализации целей рутера LoRA, который не только должен выбирать адаптер, но и должен обеспечивать уверенность в том, что адаптер будет выбран с минимальными затратами на вычисления. Мы разработали SEQR, который использует законность нормы активации для эффективного выбора адаптера, и предоставили архитектуру, которая обеспечивает высокую производительность и гибкость в различных сценариях применения. ## Результаты Мы проверили работу SEQR на различных наборах данных, включая задачи с разным количеством адаптеров и различной сложностью. Мы сравнили SEQR с другими существующими методами, такими как LoRA-Router и традиционные методы самостоятельного обучения. Наши эксперименты показали, что SEQR обеспечивает более точный выбор адаптера, чем другие методы, с меньшими затратами на вычисления и более высокой скоростью обработки. Кроме того, мы проверили наши результаты на защищенных данных и показали, что SEQR обеспечивает безопасность не только в области гибкости, но и в области конфиденциальности. ## Значимость SEQR может быть применен в различных сферах, включая безопасные и эффективные системы рутера для языковых моделей, защищенных приложений, где конфиденциальность и безопасность являются ключевыми аспектами. Наш подход предоставляет более эффективный и надежный способ выбора адаптеров, чем существующие решения. Это может привести к более бы

Abstract

Low-Rank Adaptation (LoRA) has become a standard technique for parameter-efficient fine-tuning of large language models, enabling large libraries of LoRAs, each for a specific task or domain. Efficiently selecting the correct LoRA adapter for a given input remains a challenge, particularly in secure environments where supervised training of routers may raise privacy concerns. Motivated by previous approaches, we formalize the goal of unsupervised LoRA routing in terms of activation norm maximization, providing a theoretical framework for analysis. We demonstrate the discriminative power of activation norms and introduce SEQR, an unsupervised LoRA routing algorithm designed to maximize efficiency while providing strict routing guarantees. SEQR provably identifies the norm-maximizing adapter with significantly greater efficiency, making it a highly scalable and effective solution for dynamic LoRA composition. We validate our results through experiments that demonstrate improved multi-task performance and efficiency.

Ссылки и действия