PAIRS: Parametric-Verified Adaptive Information Retrieval and Selection for Efficient RAG
2508.04057v1
cs.CL
2025-08-09
Авторы:
Wang Chen, Guanqiang Qi, Weikang Li, Yang Li, Deguo Xia, Jizhou Huang
Резюме на русском
**Резюме**
В статье предлагается PAIRS, новая стратегия для Retrieval-Augmented Generation (RAG), способная улучшить его эффективность и точность. Основная проблема, решаемая PAIRS, состоит в двух аспектах: неэффективном использовании внешней информации для простых запросов и риске получения неподходящих документов при недостатке информационных признаков в запросе. Решением становится концепция Parametric-verified Adaptive Information Retrieval and Selection, которая включает два подхода: 1) двухканальная процедура генерации — LLM создает ответы как на основе внешних документов, так и самостоятельно, и 2) Adaptive Information Selection, которая позволяет выбирать документы с учетом их взаимных сходств. Таким образом, PAIRS может полностью обойти внешнюю поисковую систему для простых запросов и улучшить точность для сложных, при этом сократив вычислительные затраты на 25%. Оценка на шести бенчмарках показала, что PAIRS улучшает метрики Exact Match (+1.1%) и F1 (+1.0%) по сравнению с базовыми моделями.
Abstract
Retrieval-Augmented Generation (RAG) has become a cornerstone technique for
enhancing large language models (LLMs) with external knowledge. However,
current RAG systems face two critical limitations: (1) they inefficiently
retrieve information for every query, including simple questions that could be
resolved using the LLM's parametric knowledge alone, and (2) they risk
retrieving irrelevant documents when queries contain sparse information
signals. To address these gaps, we introduce Parametric-verified Adaptive
Information Retrieval and Selection (PAIRS), a training-free framework that
integrates parametric and retrieved knowledge to adaptively determine whether
to retrieve and how to select external information. Specifically, PAIRS employs
a dual-path generation mechanism: First, the LLM produces both a direct answer
and a context-augmented answer using self-generated pseudo-context. When these
outputs converge, PAIRS bypasses external retrieval entirely, dramatically
improving the RAG system's efficiency. For divergent cases, PAIRS activates a
dual-path retrieval (DPR) process guided by both the original query and
self-generated contextual signals, followed by an Adaptive Information
Selection (AIS) module that filters documents through weighted similarity to
both sources. This simple yet effective approach can not only enhance
efficiency by eliminating unnecessary retrievals but also improve accuracy
through contextually guided retrieval and adaptive information selection.
Experimental results on six question-answering (QA) benchmarks show that PAIRS
reduces retrieval costs by around 25% (triggering for only 75% of queries)
while still improving accuracy-achieving +1.1% EM and +1.0% F1 over prior
baselines on average.
Ссылки и действия
Дополнительные ресурсы: