HiCoLoRA: Addressing Context-Prompt Misalignment via Hierarchical Collaborative LoRA for Zero-Shot DST

2509.19742v1 cs.CL, cs.AI, cs.IR 2025-09-26
Авторы:

Shuyu Zhang, Yifan Wei, Xinru Wang, Yanmin Zhu, Yangfan He, Yixuan Weng, Bin Li

Резюме на русском

#### Контекст Zero-shot Dialog State Tracking (zs-DST) является кллючевым компонентом для обеспечения гибкости и обобщаемости Task-Oriented Dialog Systems (TODs) при работе с новыми доменами без необходимости дорогостоящей аннотации данных. Однако, эта задача сталкивается с значительными вызовами, связанными с semantic misalignment между динамичными dialog contexts и статичными prompts. Это приводит к проблемам, таким как inflexible cross-layer coordination, domain interference, и catastrophic forgetting. Таким образом, целью данного исследования является разработка эффективного подхода, который улучшит cross-domain generalization zs-DST, устранив эти проблемы. #### Метод HiCoLoRA — это новая архитектура, основанная на Hierarchical Collaborative Low-Rank Adaptation (HiCoLoRA), которая улучшает zero-shot slot inference через robust prompt alignment. Основной элемент данного подхода — hierarchical LoRA architecture, которая обеспечивает dynamic layer-specific processing. Эта архитектура комбинирует lower-layer heuristic grouping с higher-layer full interaction для более точного взаимодействия в различных слоях. Также, в HiCoLoRA используется Spectral Joint Domain-Slot Clustering для идентификации transferable associations, которые подключаются к Adaptive Linear Fusion Mechanism для более точного объединения этих связей. Для сохранения и превращения pre-trained knowledge в новые знания во время fine-tuning, в HiCoLoRA используется Semantic-Enhanced SVD Initialization (SemSVD-Init). #### Результаты Запуск HiCoLoRA на мульти-доменных датасетах MultiWOZ и SGD показал его превосходство над существующими baseline-ами в zs-DST. Он достиг совершенно новых результатов в этой области, обеспечив State-of-the-Art (SOTA) результаты. Эксперименты проводились с различными параметрами и настройками, подтверждающими значительные преимущества HiCoLoRA в области cross-domain generalization и zero-shot slot inference. Код, реализующий данный подход, доступен на GitHub по ссылке: https://github.com/carsonz/HiCoLoRA. #### Значимость HiCoLoRA может быть использован в различных приложениях, таких как Task-Oriented Dialog Systems (TODs), которые требуют гибкой и обобщаемой обработки запросов в различных ситуациях. Основные преимущества HiCoLoRA включают в себя enhanced cross-layer coordination, domain interference reduction, и robust zero-shot slot inference. Данный подход имеет потенциал для значительного улучшения quality и efficiency в Task-Oriented Dialog Systems, обеспечивая более гибкое и эффективное обращение к динамичным запросам в новых доменах. #### Выводы HiCoLoRA продемонстрировал свою эффективность в решении проблем с semantic misalignment в zero-shot Dialog State Tracking. Он позиционируется как State-of-the-Art решение для новых доменов без необходимости дополнительных данных. Будущими направлениями исследований будут: улучшение adaptive fusion mechanisms, расширение поддержки датасетов, и исследование дальнейшего улучшения zero-shot generalization across различных NLP-задач.

Abstract

Zero-shot Dialog State Tracking (zs-DST) is essential for enabling Task-Oriented Dialog Systems (TODs) to generalize to new domains without costly data annotation. A central challenge lies in the semantic misalignment between dynamic dialog contexts and static prompts, leading to inflexible cross-layer coordination, domain interference, and catastrophic forgetting. To tackle this, we propose Hierarchical Collaborative Low-Rank Adaptation (HiCoLoRA), a framework that enhances zero-shot slot inference through robust prompt alignment. It features a hierarchical LoRA architecture for dynamic layer-specific processing (combining lower-layer heuristic grouping and higher-layer full interaction), integrates Spectral Joint Domain-Slot Clustering to identify transferable associations (feeding an Adaptive Linear Fusion Mechanism), and employs Semantic-Enhanced SVD Initialization (SemSVD-Init) to preserve pre-trained knowledge. Experiments on multi-domain datasets MultiWOZ and SGD show that HiCoLoRA outperforms baselines, achieving SOTA in zs-DST. Code is available at https://github.com/carsonz/HiCoLoRA.

Ссылки и действия