Research on Multi-hop Inference Optimization of LLM Based on MQUAKE Framework
2509.04770v1
cs.CL, cs.LG
2025-09-09
Авторы:
Zucheng Liang, Wenxin Wei, Kaijie Zhang, Hongyi Chen
Резюме на русском
####################
## Контекст
####################
Общий контекст работы связан с проблематикой точного ответа на комплексные вопросы с использованием Large Language Models (LLMs). Несмотря на развитие технологий обработки естественного языка, ответ на вопросы, требующие нескольких этапов логического рассуждения, до сих пор остается сложной задачей. Эта проблема мотивирует разработку эффективных методов для разбиения комплексных вопросов на более простые подзадачи. Эта инициатива в рамках MQUAKE-фреймворка становится решением проблемы не только для декомпозиции вопросов, но и для улучшения LLM-моделей в области логического мышления. Задача такого разделения включает в себя не только оптимизацию процесса ответа, но и повышение точности моделей при работе с различными типами данных.
####################
## Метод
####################
В этой работе используется методология MQUAKE, которая предлагает разделение вопросов на несколько логических шагов (многохопное декомпозирование). Для оценки эффективности этого подхода используется модель LLAMA3. Для экспериментов применяется датасет MQUAKE-T, который разделяется на две части: одна для декомпозиционного подхода, другая — для прямого ответа на вопросы. Модель LLAMA3 дообучается (fine-tuning) с использованием метода LoRA (Low-Rank Adaptation) на этих датасетах. Это позволяет изучить влияние многохопного декомпозирования как до, так и после обучения модели. Таким образом, метод гарантирует понимание сложных вопросов и повышает точность ответа, обеспечивая структуру рассуждения.
####################
## Результаты
####################
В экспериментах был проведен сравнительный анализ точности ответов на основе двух подходов: прямого ответа на комплексные вопросы и многохопного декомпозирования. Результаты показали, что перед дообучением модели LLAMA3, подход многохопного декомпозирования показывал значительное превосходство в предсказаниях. Однако, после дообучения с помощью метода LoRA, оба подхода показали улучшение, но многохопное декомпозирование сохранило свою выгоду. Эти результаты демонстрируют, что многохопное декомпозирование не только повышает качество предсказаний до обучения, но и позволяет более эффективно использовать модель после ее дообучения.
####################
## Значимость
####################
Этот подход имеет широкие применения в области разработки интеллектуальных систем, а именно в помощных системах для точного ответа на вопросы, в обучении моделей глубокого обучения, а также в системах семантического поиска. Многохопное декомпозирование позволяет улучшить точность моделей, обеспечивая более глубокую и адекватную обработку текстов. Кроме того, полученные результаты могут быть использованы в разработке систем для автоматического обучения, чтобы повысить уровень
Abstract
Accurately answering complex questions has consistently been a significant
challenge for Large Language Models (LLMs). To address this, this paper
proposes a multi-hop question decomposition method for complex questions,
building upon research within the MQUAKE framework. Utilizing the LLAMA3 model,
we systematically investigate the impact of multi-hop question decomposition
within knowledge graphs on model comprehension and reasoning accuracy, both
before and after model training. In our experiments, we systematically
partitioned and converted the MQUAKE-T dataset into two distinct formats: a
single-hop dataset designed for directly answering complex questions, and a
multi-hop dataset constructed using the multi-hop question decomposition
method. We then fine-tuned the LLAMA3 model on these datasets and conducted
inference tests. Our results demonstrate that, without fine-tuning the LLM, the
prediction performance based on the multi-hop question decomposition method
significantly outperforms the method of directly answering complex questions.
After fine-tuning using the LoRA (Low-Rank Adaptation) method, the performance
of both approaches improved compared to the untrained baseline. Crucially, the
method utilizing multi-hop decomposition consistently maintained its
superiority. These findings validate the effectiveness of the multi-hop
decomposition method both before and after training, demonstrating its
capability to effectively enhance the LLM's ability to answer complex
questions.
Ссылки и действия
Дополнительные ресурсы: