## Контекст
В современной области отбора информации сталкиваются с рядом ограничений, связанных с использованием последовательных методов повторного оценивания (reranking). Ограничением является качество исходного результата отбора, которое определяет качество всего процесса. Более того, рост вычислительных требований для моделей типа Large Language Models (LLM) увеличивает затраты на рекурсивную оценку документов. Эти ограничения влияют на то, насколько эффективно могут быть обработаны большие объемы документов. Необходимо разработать новый подход, который сможет повысить эффективность отбора в условиях ограниченного бюджета на рекурсивную оценку.
## Метод
Новая методология, предложенная авторами, Reranker-Guided-Search (RGS), представляет собой непоследовательный подход к достижению целей отбора. Она основывается на графах близости, построенных с использованием алгоритмов удаленности (approximate nearest neighbor algorithms). Этот подход стратегически выбирает документы для повторного оценивания, опираясь на прогноз модели повторного оценивания (reranker). Этот подход позволяет лучше использовать ресурсы, ограничивая число документов, подлежащих повторному проверке. Решение заключается в алгоритме поиска, применяющемся к графу близости, для оптимизации выбора документов, которые будут использоваться для повторного оценивания.
## Результаты
В экспериментах показано, что новый подход существенно повышает эффективность отбора. Улучшения наблюдаются по разным метрикам на нескольких наборах данных. Например, есть прирост в 3.5 баллов на BRIGHT, 2.9 на FollowIR, и 5.1 на M-BEIR. Этот результат достигнут в пределах установленного ограничения на число документов, подлежащих повторному оцениванию (100 документов). Эти результаты подтверждают, что стратегический выбор документов для повторного оценивания может улучшить точность отбора, даже при ограничениях на ресурсы.
## Значимость
Результаты имеют значительное значение для приложений, где необходима высокая точность отбора в условиях ограниченных ресурсов, таких как мобильные приложения, системы поиска в реальном времени и системы поддержки принятия решений. Выгоды Reranker-Guided-Search заключаются в его способности оптимизировать выборс точек для повторного оценивания, что позволяет экономить вычислительные ресурсы без ущерба для точности. Это может привести к более быстрому и эффективному отбору, что важно для реального времени и ограниченных ресурсов.
## Выводы
Результаты доказывают, что RGS является эффективным инструментом для повышения точности отбора в условиях ограниченных ресурсов. Он может использоваться в разных сферах, где необходима эффективная обработка больших наборов документов.