PAIRS: Parametric-Verified Adaptive Information Retrieval and Selection for Efficient RAG

2508.04057v1 cs.CL 2025-08-09
Авторы:

Wang Chen, Guanqiang Qi, Weikang Li, Yang Li, Deguo Xia, Jizhou Huang

Резюме на русском

**Резюме** В статье предлагается PAIRS, новая стратегия для Retrieval-Augmented Generation (RAG), способная улучшить его эффективность и точность. Основная проблема, решаемая PAIRS, состоит в двух аспектах: неэффективном использовании внешней информации для простых запросов и риске получения неподходящих документов при недостатке информационных признаков в запросе. Решением становится концепция Parametric-verified Adaptive Information Retrieval and Selection, которая включает два подхода: 1) двухканальная процедура генерации — LLM создает ответы как на основе внешних документов, так и самостоятельно, и 2) Adaptive Information Selection, которая позволяет выбирать документы с учетом их взаимных сходств. Таким образом, PAIRS может полностью обойти внешнюю поисковую систему для простых запросов и улучшить точность для сложных, при этом сократив вычислительные затраты на 25%. Оценка на шести бенчмарках показала, что PAIRS улучшает метрики Exact Match (+1.1%) и F1 (+1.0%) по сравнению с базовыми моделями.

Abstract

Retrieval-Augmented Generation (RAG) has become a cornerstone technique for enhancing large language models (LLMs) with external knowledge. However, current RAG systems face two critical limitations: (1) they inefficiently retrieve information for every query, including simple questions that could be resolved using the LLM's parametric knowledge alone, and (2) they risk retrieving irrelevant documents when queries contain sparse information signals. To address these gaps, we introduce Parametric-verified Adaptive Information Retrieval and Selection (PAIRS), a training-free framework that integrates parametric and retrieved knowledge to adaptively determine whether to retrieve and how to select external information. Specifically, PAIRS employs a dual-path generation mechanism: First, the LLM produces both a direct answer and a context-augmented answer using self-generated pseudo-context. When these outputs converge, PAIRS bypasses external retrieval entirely, dramatically improving the RAG system's efficiency. For divergent cases, PAIRS activates a dual-path retrieval (DPR) process guided by both the original query and self-generated contextual signals, followed by an Adaptive Information Selection (AIS) module that filters documents through weighted similarity to both sources. This simple yet effective approach can not only enhance efficiency by eliminating unnecessary retrievals but also improve accuracy through contextually guided retrieval and adaptive information selection. Experimental results on six question-answering (QA) benchmarks show that PAIRS reduces retrieval costs by around 25% (triggering for only 75% of queries) while still improving accuracy-achieving +1.1% EM and +1.0% F1 over prior baselines on average.

Ссылки и действия