Query-Centric Graph Retrieval Augmented Generation
2509.21237v1
cs.CL, cs.IR, I.2.7; H.3.3
2025-09-27
Авторы:
Yaxiong Wu, Jianyuan Bo, Yongyue Zhang, Sheng Liang, Yong Liu
Резюме на русском
#### Контекст
В последнее время граф-ориентированная восстановленная получение (Graph-based Retrieval-Augmented Generation, RAG) получила популярность в области технологий обработки естественного языка. Она обогащает большие языковые модели (LLMs) снаружиготовой знаниями для решения задач, требующих длинных контекстов и нескольких шагов рассуждений. Однако существующие методы сталкиваются с проблемой гранулярности: тонкому разбиению на сущности возникают высокие затраты на токены, что приводит к утере контекста, а крупномасштабные документы не удается полностью охватить статистические связи. Это конфликт приводит к неэффективности в области многошагового рассуждения. Для решения этой проблемы был предложен подход, ориентированный на запрос, который более эффективно обрабатывает запросы на основе графов с управляемой гранулярностью.
#### Метод
Методология QCG-RAG основывается на создании запроса-центричных графов с использованием Doc2Query и Doc2Query-{}{-}. Эти графы построены на основе запросов и структурных элементов документов, что позволяет управлять гранулярностью. Чтобы улучшить качество графа и его интерпретируемость, метод Doc2Query{-}{-} используется для более точного отображения контекста. Для выбора актуальных чанков входного запроса используется новая механика поиска с несколькими шагами, которая позволяет построить интерпретируемое и эффективное решение. Этот подход представляет собой новую модель для многошаговых рассуждений, обеспечивая улучшенное качество ответа.
#### Результаты
В экспериментах, проведенных на датасетовах LiHuaWorld и MultiHop-RAG, QCG-RAG показал существенные достижения в сравнении с другими подходами. Он улучшил точность ответов в задачах восстановления и многошагового рассуждения, показав свою эффективность в обработке запросов, требующих длинных контекстов. Эти результаты подтвердят преимущества QCG-RAG в сравнении с традиционными методами, устанавливая новую модель для решения задач в области многошагового обработки естественного языка.
#### Значимость
QCG-RAG может применяться в различных сферах, где требуются длинные контексты и многошаговые рассуждения, таких как распознавание речи, создание текста и вопрос-ответ-системы. Он обеспечивает улучшенную точность и интерпретируемость, что создает более эффективный подход к обработке естественного языка. Этот подход также может существенно повлиять на развитие технологий, обеспечивая более точную и эффективную обработку данных в различных приложениях.
#### Выводы
Исследование QCG-RAG устанавливает новую модель для многошагового рассуждения, показывая его п
Abstract
Graph-based retrieval-augmented generation (RAG) enriches large language
models (LLMs) with external knowledge for long-context understanding and
multi-hop reasoning, but existing methods face a granularity dilemma:
fine-grained entity-level graphs incur high token costs and lose context, while
coarse document-level graphs fail to capture nuanced relations. We introduce
QCG-RAG, a query-centric graph RAG framework that enables query-granular
indexing and multi-hop chunk retrieval. Our query-centric approach leverages
Doc2Query and Doc2Query{-}{-} to construct query-centric graphs with
controllable granularity, improving graph quality and interpretability. A
tailored multi-hop retrieval mechanism then selects relevant chunks via the
generated queries. Experiments on LiHuaWorld and MultiHop-RAG show that QCG-RAG
consistently outperforms prior chunk-based and graph-based RAG methods in
question answering accuracy, establishing a new paradigm for multi-hop
reasoning.