GRAIL:Learning to Interact with Large Knowledge Graphs for Retrieval Augmented Reasoning

2508.05498v1 cs.AI 2025-08-08
Авторы:

Ge Chang, Jinbo Su, Jiacheng Liu, Pengfei Yang, Yuhao Shang, Huiwen Zheng, Hongli Ma, Yan Liang, Yuanchun Li, Yunxin Liu

Резюме на русском

## КОНТЕКСТ И ПРОБЛЕМАТИКА Large Language Models (LLMs) в сочетании с техниками Retrieval-Augmented Generation (RAG) показали выдающиеся результаты в различных областях. Однако существующие подходы RAG ориентированы в основном на работу с неструктурированными данными и имеют ограниченные возможности для обработки структурированных знаний, таких как графы знаний. Это создает значительные проблемы, так как графы знаний представляют собой ключевую форму структурированной информации, и их эффективное использование требует умения контролировать точность и содержательность получаемых данных. Традиционные методы ретриева графов сталкиваются со сложностями, связанными с захватом целостной структуры графа и одновременной поддержкой высокой точности. Эти проблемы приводят либо к недостатку критической информации, либо к чрезмерному количеству избыточных соединений, что негативно сказывается на качестве вывода. Эти ограничения существенно ограничивают эффективность применения LLMs в задачах, требующих рационального использования графов знаний для построения выводов. Таким образом, необходимо разработать новый подход, который позволит интегрировать LLMs с графами знаний для эффективного вывода, поддерживая баланс между широтой и точностью получаемых данных. Такая задача требует создания эффективной методологии, которая бы обеспечила глубокое понимание структуры графа и динамически адаптировалась к потребностям задачи. ## ПРЕДЛОЖЕННЫЙ МЕТОД Чтобы решить эту проблему, авторы предлагают GRAIL (Graph-Retrieval Augmented Interactive Learning), фреймворк, основанный на интерактивном обучении для работы с большими графами знаний. GRAIL сочетает LLM-guided random exploration с path filtering для создания синтезированных данных, которые используются в дальнейшем для обучения. Это позволяет генерировать детальные траектории вывода для каждой задачи. В GRAIL реализован двухступенчатый процесс обучения, при котором разрабатывается политика для динамического выбора оптимальных действий на каждом шаге вывода. Эта политика направлена на достижение баланса между точностью и консистентностью ретриева, что повышает эффективность и стабильность обучения. Для достижения этого баланса используются тонкогранулярные награды, которые помогают оптимизировать процесс обучения. В рамках развертывания GRAIL используется интерактивный режим ретриева, где модель автоматически исследует пути в графе, одновременно контролируя широту и точность поиска. Это позволяет достигать оптимального соотношения между количеством получаемых данных и их качеством, что является ключевым фактором успеха системы. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗЫЛЬТАТЫ Для оценки эффективности GRAIL проведены эксперименты на трех наборах данных по задачам вопросов и ответов на основе графов знаний. Результаты показали значительные улучшения показателей. Использование GRAIL привело к повышению точности на 21.01% и F1-меры на 22.43% по сравнению со существующими методами. Эксперименты также демонстрируют высокую эффективность динамического поиска и балансировки широты и точности ретриева. Метод GRAIL успешно справляется со сложностями, связанными с ретриевом графов знаний, обеспечивая качественный вывод на основе структурированных данных. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ GRAIL имеет широкое применение в областях, требующих работы с графами знаний, таких как вопросно-ответные системы, рекомендательные системы и системы поддержки принятия решений. Благодаря своей способности динамически адаптироваться к потребностям задачи, GRAIL может значительно повысить эффективность работы с графами знаний, обеспечивая более точные и содержательные результаты. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ GRAIL представляет собой передовое решение для интеграции LLMs с графами знаний, обеспечивающее высокую точность и эффективность в задачах вывода. Будущие исследования могут фокусироваться на дальнейшем улучшении точности и скорости ретриева, а также на расширении областей применения этого подхода. Исходный код и наборы данных GRAIL доступны для дальнейшего исследования и развития.

Abstract

Large Language Models (LLMs) integrated with Retrieval-Augmented Generation (RAG) techniques have exhibited remarkable performance across a wide range of domains. However, existing RAG approaches primarily operate on unstructured data and demonstrate limited capability in handling structured knowledge such as knowledge graphs. Meanwhile, current graph retrieval methods fundamentally struggle to capture holistic graph structures while simultaneously facing precision control challenges that manifest as either critical information gaps or excessive redundant connections, collectively undermining reasoning performance. To address this challenge, we propose GRAIL: Graph-Retrieval Augmented Interactive Learning, a framework designed to interact with large-scale graphs for retrieval-augmented reasoning. Specifically, GRAIL integrates LLM-guided random exploration with path filtering to establish a data synthesis pipeline, where a fine-grained reasoning trajectory is automatically generated for each task. Based on the synthesized data, we then employ a two-stage training process to learn a policy that dynamically decides the optimal actions at each reasoning step. The overall objective of precision-conciseness balance in graph retrieval is decoupled into fine-grained process-supervised rewards to enhance data efficiency and training stability. In practical deployment, GRAIL adopts an interactive retrieval paradigm, enabling the model to autonomously explore graph paths while dynamically balancing retrieval breadth and precision. Extensive experiments have shown that GRAIL achieves an average accuracy improvement of 21.01% and F1 improvement of 22.43% on three knowledge graph question-answering datasets. Our source code and datasets is available at https://github.com/Changgeww/GRAIL.

Ссылки и действия