Research on Multi-hop Inference Optimization of LLM Based on MQUAKE Framework

2509.04770v1 cs.CL, cs.LG 2025-09-09

Авторы:

Zucheng Liang, Wenxin Wei, Kaijie Zhang, Hongyi Chen

Резюме на русском

#################### ## Контекст #################### Общий контекст работы связан с проблематикой точного ответа на комплексные вопросы с использованием Large Language Models (LLMs). Несмотря на развитие технологий обработки естественного языка, ответ на вопросы, требующие нескольких этапов логического рассуждения, до сих пор остается сложной задачей. Эта проблема мотивирует разработку эффективных методов для разбиения комплексных вопросов на более простые подзадачи. Эта инициатива в рамках MQUAKE-фреймворка становится решением проблемы не только для декомпозиции вопросов, но и для улучшения LLM-моделей в области логического мышления. Задача такого разделения включает в себя не только оптимизацию процесса ответа, но и повышение точности моделей при работе с различными типами данных. #################### ## Метод #################### В этой работе используется методология MQUAKE, которая предлагает разделение вопросов на несколько логических шагов (многохопное декомпозирование). Для оценки эффективности этого подхода используется модель LLAMA3. Для экспериментов применяется датасет MQUAKE-T, который разделяется на две части: одна для декомпозиционного подхода, другая — для прямого ответа на вопросы. Модель LLAMA3 дообучается (fine-tuning) с использованием метода LoRA (Low-Rank Adaptation) на этих датасетах. Это позволяет изучить влияние многохопного декомпозирования как до, так и после обучения модели. Таким образом, метод гарантирует понимание сложных вопросов и повышает точность ответа, обеспечивая структуру рассуждения. #################### ## Результаты #################### В экспериментах был проведен сравнительный анализ точности ответов на основе двух подходов: прямого ответа на комплексные вопросы и многохопного декомпозирования. Результаты показали, что перед дообучением модели LLAMA3, подход многохопного декомпозирования показывал значительное превосходство в предсказаниях. Однако, после дообучения с помощью метода LoRA, оба подхода показали улучшение, но многохопное декомпозирование сохранило свою выгоду. Эти результаты демонстрируют, что многохопное декомпозирование не только повышает качество предсказаний до обучения, но и позволяет более эффективно использовать модель после ее дообучения. #################### ## Значимость #################### Этот подход имеет широкие применения в области разработки интеллектуальных систем, а именно в помощных системах для точного ответа на вопросы, в обучении моделей глубокого обучения, а также в системах семантического поиска. Многохопное декомпозирование позволяет улучшить точность моделей, обеспечивая более глубокую и адекватную обработку текстов. Кроме того, полученные результаты могут быть использованы в разработке систем для автоматического обучения, чтобы повысить уровень

Abstract

Accurately answering complex questions has consistently been a significant challenge for Large Language Models (LLMs). To address this, this paper proposes a multi-hop question decomposition method for complex questions, building upon research within the MQUAKE framework. Utilizing the LLAMA3 model, we systematically investigate the impact of multi-hop question decomposition within knowledge graphs on model comprehension and reasoning accuracy, both before and after model training. In our experiments, we systematically partitioned and converted the MQUAKE-T dataset into two distinct formats: a single-hop dataset designed for directly answering complex questions, and a multi-hop dataset constructed using the multi-hop question decomposition method. We then fine-tuned the LLAMA3 model on these datasets and conducted inference tests. Our results demonstrate that, without fine-tuning the LLM, the prediction performance based on the multi-hop question decomposition method significantly outperforms the method of directly answering complex questions. After fine-tuning using the LoRA (Low-Rank Adaptation) method, the performance of both approaches improved compared to the untrained baseline. Crucially, the method utilizing multi-hop decomposition consistently maintained its superiority. These findings validate the effectiveness of the multi-hop decomposition method both before and after training, demonstrating its capability to effectively enhance the LLM's ability to answer complex questions.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Research on Multi-hop Inference Optimization of LLM Based on MQUAKE Framework

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

A Preliminary Study on the Promises and Challenges of Native Top-$k$ Sparse Atte...

Computational Linguistics Meets Libyan Dialect: A Study on Dialect Identificatio...

Sarcasm Detection on Reddit Using Classical Machine Learning and Feature Enginee...

Four Over Six: More Accurate NVFP4 Quantization with Adaptive Block Scaling

Enhancing Job Matching: Occupation, Skill and Qualification Linking with the ESC...

Навигация