From Ranking to Selection: A Simple but Efficient Dynamic Passage Selector for Retrieval Augmented Generation

2508.09497v1 cs.CL, cs.AI 2025-08-15

Авторы:

Siyuan Meng, Junming Liu, Yirong Chen, Song Mao, Pinlong Cai, Guohang Yan, Botian Shi, Ding Wang

Резюме на русском

## Контекст РетриEва-аугмемтиед генерация (RAG) системы широко используются для решения задач, требующих обработки сложных запросов и синтеза информации из различных документов. Одним из основных элементов этих систем является модуль переупорядочения (reranking), который отвечает за выбор наиболее подходящих документов для генерации ответа. Существующие подходы, такие как point-wise и list-wise методы, сталкиваются с проблемами, такими как неэффективность в обработке многоуровневых запросов и недостаточная адаптивность в выборе документов. Эти ограничения приводят к потерям в точности и работе системы в целом. Мотивация заключается в разработке более эффективного метода переупорядочения, который мог бы преодолеть эти ограничения и повысить производительность RAG-систем. ## Метод Предлагаемый подход, Dynamic Passage Selector (DPS), представляет собой новую модель переупорядочения, которая подходит к выбору документов как к задаче супервизованного обучения. Модель обучается используя методы глубокого обучения, которые учитывают не только содержание документов, но и их взаимосвязи. DPS адаптивно выбирает набор документов, который используется для генерации ответа, не ограничиваясь фиксированным размером набора (например, Top-K). Эта архитектура включает в себя несколько ключевых компонентов, такие как представление документов, механизм сравнения и интеграция в RAG-пайплайн. Модель тренируется на нынешних данных, которые отражают сложные запросы, и оценивается с помощью метрик, таких как F1-мери и ROUGE, для оценки качества. ## Результаты Результаты экспериментов показывают, что DPS показывает преимущества по сравнению с текущими методами. На датасете MuSiQue, DPS демонстрирует увеличение F1-меры на 30.06% по сравнению с Qwen3-reranker и на 15.4% по сравнению с RankingGPT. Эти результаты указывают на то, что DPS эффективно отбирает документы для генерации, даже при сложности запросов. Дополнительно, DPS показывает улучшение в параметрах точности и recall, что указывает на преимущество адаптивного выбора документов. Эти результаты были получены на пяти разных датасетах, что подтверждает общую эффективность нового подхода. ## Значимость Данный подход может использоваться в системах RAG для обработки сложных запросов, включая многоуровневые задачи, где необходимо синтезировать информацию из различных источников. DPS может применяться в области обработки естественного языка, в том числе для систем поиска информации, генерации ответов и других приложений, требующих высокого качества выбора документов. Это включает приложения в области здравоохранения, финансов и юриспруденции, где то

Abstract

Retrieval-augmented generation (RAG) systems are often bottlenecked by their reranking modules, which typically score passages independently and select a fixed Top-K size. This approach struggles with complex multi-hop queries that require synthesizing evidence across multiple documents, creating a trade-off where small K values omit crucial information and large K values introduce noise. To address this, we introduce the Dynamic Passage Selector (DPS), a novel reranking framework that treats passage selection as a supervised learning problem. Unlike traditional point-wise or list-wise methods, DPS is fine-tuned to capture inter-passage dependencies and dynamically select the most relevant set of passages for generation. As a seamless plug-and-play module, DPS requires no modifications to the standard RAG pipeline. Comprehensive evaluations on five benchmarks show that DPS consistently outperforms state-of-the-art rerankers and fine-tuning methods. Notably, on the challenging MuSiQue dataset, DPS improves the F1-score by 30.06% and 15.4% over strong baselines like Qwen3-reranker and RankingGPT, respectively. Our results demonstrate that by enabling adaptive evidence selection, DPS substantially enhances reasoning capabilities in complex RAG scenarios.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

From Ranking to Selection: A Simple but Efficient Dynamic Passage Selector for Retrieval Augmented Generation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

UW-BioNLP at ChemoTimelines 2025: Thinking, Fine-Tuning, and Dictionary-Enhanced...

AdmTree: Compressing Lengthy Context with Adaptive Semantic Trees

SignRoundV2: Closing the Performance Gap in Extremely Low-Bit Post-Training Quan...

Mitigating Catastrophic Forgetting in Target Language Adaptation of LLMs via Sou...

SEAL: Self-Evolving Agentic Learning for Conversational Question Answering over ...

Навигация