Tackling Distribution Shift in LLM via KILO: Knowledge-Instructed Learning for Continual Adaptation

2508.03571v1 cs.CL, cs.LG 2025-08-09
Авторы:

Iing Muttakhiroh, Thomas Fevens

Резюме на русском

**Резюме** Проблема: Large Language Models (LLMs) часто сталкиваются с ухудшением производительности при выполнении задач в новых доменах из-за проблемы катастрофического забывания (catastrophic forgetting). Решение: В статье предложена методика KILO (Knowledge-Instructed Learning for Continual Adaptation), которая интегрирует динамические знания из графов знаний (knowledge graphs) с инструкционным обучением (instruction tuning). Метод KILO использует во время обучения внешние знания, полученные с помощью восстановления, как дополнительный стимул для модели. Эта модель была протестирована на последовательном адаптировании к четырём разным доменам: BioASQ, SciQ, TweetEval и MIND. Результаты: Модель KILO показала лучшие результаты по сравнению с основными базовыми моделями, в том числе ERNIE 2.0 и CPT, в плане производительности, эффективности обучения и способности сохранить данные из предыдущих доменов. Вывод: Объединение внешних знаний с инструкционным обучением даёт эффективный метод для преодоления проблемы катастрофического забывания в LLMs при адаптации к новым доменам.

Abstract

Large Language Models (LLMs) often suffer from performance degradation when faced with domain shifts, primarily due to catastrophic forgetting. In this work, we propose KILO (Knowledge-Instructed Learning for Continual Adaptation), a novel continual learning framework that integrates dynamic knowledge graphs with instruction tuning. By leveraging retrieved domain-specific knowledge as guidance during training, KILO enhances both adaptability to new domains and retention of previously acquired knowledge. We pretrain our model on WikiText-103 and evaluate sequential adaptation across four diverse target domains: BioASQ, SciQ, TweetEval, and MIND. Our experiments demonstrate that KILO consistently outperforms strong baselines, including continual fine-tuning, ERNIE 2.0, and CPT, in terms of backward transfer, forward transfer, F1 score, retention rate, and training efficiency. These results highlight the effectiveness of combining structured knowledge retrieval and instruction prompting to overcome domain shift challenges in continual learning scenarios.

Ссылки и действия