Routing Distilled Knowledge via Mixture of LoRA Experts for Large Language Model based Bundle Generation
2508.17250v1
cs.CL, cs.IR
2025-08-27
Авторы:
Kaidong Feng, Zhu Sun, Hui Fang, Jie Yang, Wenyuan Liu, Yew-Soon Ong
Резюме на русском
## Контекст
Large Language Models (LLMs) показали свою эффективность в автоматической генерации бандлов, однако их вычислительные затраты остаются высокими. Несмотря на то, что методы знанийых знаний предлагают возможность создания эффективных моделей через познание от моделей-учителей (teacher LLMs), наш предварительный анализ показал, что простое объединение различных видов полученных знаний может привести к конфликту между ними, что в свою очередь мешает работе модели в целях генерации бандлов. Чтобы устранить эту проблему, мы предлагаем RouteDK, платформу для маршрутизации полученных знаний с помощью смеси экспертов (LoRA), которая оптимизирует знания от разных типов.
## Метод
Мы предлагаем два типа знаний, которые могут быть получены от модели-учителя: высокоуровневые знания (общие правила) и тонкоуровневые знания (специфичные для сессии). Для каждого типа знаний мы обучаем особые экспертов LoRA, каждый из которых учитывает свой тип знаний. Мы также разработали динамический модуль слияния (dynamic fusion module), который включает в себя информацию о входных данных и роутер, который динамически настраивает веса для каждого эксперта LoRA, чтобы минимизировать конфликты между знаниями. Для сокращения разброса при инференции мы также добавили модуль улучшения инференции, который повышает надежность результатов.
## Результаты
Мы провели эксперименты на трех открытых наборах данных. Наши результаты показали, что RouteDK достигает той же точности, что и модель-учитель, при этом оставляя вычислительные затраты намного ниже. Этот подход показал себя лучше, чем другие современные методы для генерации бандлов. Мы также обнаружили, что наше решение эффективно решает проблему конфликта знаний, что является ключевым фактором улучшения качества генерации бандлов.
## Значимость
Предложенный подход RouteDK может быть применен в различных областях, где необходима автоматизация генерации бандлов, таких как робототехника, ИИ-помощники и системы рекомендаций. Наш подход не только улучшает точность и эффективность, но и предоставляет мощное инструмент для обработки сложных типов знаний. Мы считаем, что RouteDK может стать основой для будущих разработок в области знанийых моделей и их применения в различных технических сферах.
## Выводы
Мы предложили RouteDK, фреймворк для маршрутизации знаний с помощью смеси экспертов LoRA для генерации бандлов. Наши эксперименты подтвердили, что данный подход достигает высокой точности, эффективности и устойчивости при инференции. Мы планируем дальнейшие исследования в области улучшения моделей знаний и их эффективного применения в раз
Abstract
Large Language Models (LLMs) have shown potential in automatic bundle
generation but suffer from prohibitive computational costs. Although knowledge
distillation offers a pathway to more efficient student models, our preliminary
study reveals that naively integrating diverse types of distilled knowledge
from teacher LLMs into student LLMs leads to knowledge conflict, negatively
impacting the performance of bundle generation. To address this, we propose
RouteDK, a framework for routing distilled knowledge through a mixture of LoRA
expert architecture. Specifically, we first distill knowledge from the teacher
LLM for bundle generation in two complementary types: high-level knowledge
(generalizable rules) and fine-grained knowledge (session-specific reasoning).
We then train knowledge-specific LoRA experts for each type of knowledge
together with a base LoRA expert. For effective integration, we propose a
dynamic fusion module, featuring an input-aware router, where the router
balances expert contributions by dynamically determining optimal weights based
on input, thereby effectively mitigating knowledge conflicts. To further
improve inference reliability, we design an inference-time enhancement module
to reduce variance and mitigate suboptimal reasoning. Experiments on three
public datasets show that our RouteDK achieves accuracy comparable to or even
better than the teacher LLM, while maintaining strong computational efficiency.
In addition, it outperforms state-of-the-art approaches for bundle generation.
Ссылки и действия
Дополнительные ресурсы: