Beyond Sequential Reranking: Reranker-Guided Search Improves Reasoning Intensive Retrieval

2509.07163v1 cs.IR, cs.CL, cs.LG 2025-09-11
Авторы:

Haike Xu, Tong Chen

Резюме на русском

## Контекст В современной области отбора информации сталкиваются с рядом ограничений, связанных с использованием последовательных методов повторного оценивания (reranking). Ограничением является качество исходного результата отбора, которое определяет качество всего процесса. Более того, рост вычислительных требований для моделей типа Large Language Models (LLM) увеличивает затраты на рекурсивную оценку документов. Эти ограничения влияют на то, насколько эффективно могут быть обработаны большие объемы документов. Необходимо разработать новый подход, который сможет повысить эффективность отбора в условиях ограниченного бюджета на рекурсивную оценку. ## Метод Новая методология, предложенная авторами, Reranker-Guided-Search (RGS), представляет собой непоследовательный подход к достижению целей отбора. Она основывается на графах близости, построенных с использованием алгоритмов удаленности (approximate nearest neighbor algorithms). Этот подход стратегически выбирает документы для повторного оценивания, опираясь на прогноз модели повторного оценивания (reranker). Этот подход позволяет лучше использовать ресурсы, ограничивая число документов, подлежащих повторному проверке. Решение заключается в алгоритме поиска, применяющемся к графу близости, для оптимизации выбора документов, которые будут использоваться для повторного оценивания. ## Результаты В экспериментах показано, что новый подход существенно повышает эффективность отбора. Улучшения наблюдаются по разным метрикам на нескольких наборах данных. Например, есть прирост в 3.5 баллов на BRIGHT, 2.9 на FollowIR, и 5.1 на M-BEIR. Этот результат достигнут в пределах установленного ограничения на число документов, подлежащих повторному оцениванию (100 документов). Эти результаты подтверждают, что стратегический выбор документов для повторного оценивания может улучшить точность отбора, даже при ограничениях на ресурсы. ## Значимость Результаты имеют значительное значение для приложений, где необходима высокая точность отбора в условиях ограниченных ресурсов, таких как мобильные приложения, системы поиска в реальном времени и системы поддержки принятия решений. Выгоды Reranker-Guided-Search заключаются в его способности оптимизировать выборс точек для повторного оценивания, что позволяет экономить вычислительные ресурсы без ущерба для точности. Это может привести к более быстрому и эффективному отбору, что важно для реального времени и ограниченных ресурсов. ## Выводы Результаты доказывают, что RGS является эффективным инструментом для повышения точности отбора в условиях ограниченных ресурсов. Он может использоваться в разных сферах, где необходима эффективная обработка больших наборов документов.

Abstract

The widely used retrieve-and-rerank pipeline faces two critical limitations: they are constrained by the initial retrieval quality of the top-k documents, and the growing computational demands of LLM-based rerankers restrict the number of documents that can be effectively processed. We introduce Reranker-Guided-Search (RGS), a novel approach that bypasses these limitations by directly retrieving documents according to reranker preferences rather than following the traditional sequential reranking method. Our method uses a greedy search on proximity graphs generated by approximate nearest neighbor algorithms, strategically prioritizing promising documents for reranking based on document similarity. Experimental results demonstrate substantial performance improvements across multiple benchmarks: 3.5 points on BRIGHT, 2.9 on FollowIR, and 5.1 on M-BEIR, all within a constrained reranker budget of 100 documents. Our analysis suggests that, given a fixed pair of embedding and reranker models, strategically selecting documents to rerank can significantly improve retrieval accuracy under limited reranker budget.

Ссылки и действия

Связанные статьи

LEAF: Knowledge Distillation of Text Embedding Models with Teacher-Aligned Repre...

Описание статьи: ## Контекст **LEAF** ("Lightweight Embedding Alignment Framework") — это инновационная методология дл...

2025-09-18

ELIXIR: Efficient and LIghtweight model for eXplaIning Recommendations

## Контекст Современные системы рекомендаций, основанные на коллаборативном фильтрировании, стали неотъемлемой частью ц...

2025-08-29

On the Theoretical Limitations of Embedding-Based Retrieval

## Контекст В последние годы векторные представления (embeddings) приобрели важное место в системах рекомендаций, восста...

2025-08-29

Do Recommender Systems Really Leverage Multimodal Content? A Comprehensive Analy...

**Резюме** В статье рассматривается проблема эффективности мультимодальных рекомендательных систем, которые используют р...

2025-08-09