Retro*: Optimizing LLMs for Reasoning-Intensive Document Retrieval

2509.24869v1 cs.IR, cs.AI, cs.CL 2025-10-01
Авторы:

Junwei Lan, Jianlyu Chen, Zheng Liu, Chaofan Li, Siqi Bao, Defu Lian

Резюме на русском

#### Контекст Современные глубоко обученные языковые модели (LLM) позволяют решать сложные задачи, включая документ-регрессию (RAG), где необходимо выявлять информацию из документов для решения задач. Однако возникает проблема точной оценки связи между задачей и кандидатскими документами, особенно когда эта связь не является явной. Это создает серьезные обрестки для существующих методов информационного поиска (IR). Недостаток точности и эффективности в оценке связи приводит к неверным выводам и неэффективности в использовании ресурсов. Таким образом, нужна новая методология, которая бы учитывала тонкую логику при оценивании документов и повышала производительность в целом. #### Метод Мы предлагаем Retro*, новую систему для решения документ-регрессии, основанную на рейтинге согласно четко определенным критериям. Метод включает в себя следующие элементы: 1. **Рубрика-ориентированная оценка релевантности**: Retro* использует формальные критерии для оценки того, насколько документ отвечает требованиям задачи. Это позволяет получить развернутую интерпретируемую оценку релевантности. 2. **Множественные пути рассуждения**: Метод поддерживает тестирование, объединяя несколько логических траекторий в единый балл релевантности, что повышает точность оценки. 3. **Оптимизация через RL**: Мы предлагаем усовершенствованный алгоритм, который использует два композитных признака для оценки каждого образца во время тренировки. Эти черты обеспечивают глубокую работу с логическими задачами и эффективность в применении. #### Результаты Мы проверили Retro* на BRIGHT benchmark, что позволило сравнить его с другими существующими методами. Результаты показали, что Retro* показывает значительное превосходство в долготерминальной точности и эффективности. Таким образом, Retro* демонстрирует новую стандартную систему по работе с документ-регрессией, показывая выдающиеся результаты в сложных сценариях с малой или неявной связью между задачей и документом. #### Значимость Предложенная система может использоваться в различных областях, где требуется точная интерпретация документов, например, в здравоохранении, в системах поддержки решений и в системах управления бизнес-данными. В отличие от существующих подходов, Retro* обеспечивает: - **Точность**: Оценка релевантности с более высоким уровнем точности. - **Производительность**: Высокая скорость и эффективность при работе с большими объемами данных. - **Скейлинг**: Может работать в различных условиях с ресурсоемкими задачами. #### Выводы Retro* представляет собой совершенно новый подход к до

Abstract

With the growing popularity of LLM agents and RAG, it has become increasingly important to retrieve documents that are essential for solving a task, even when their connection to the task is indirect or implicit. Addressing this problem requires fine-grained reasoning to accurately assess the relevance between the task and each candidate document. This capability, however, poses a significant challenge for existing IR techniques. Despite recent progress in reasoning-enhanced IR, existing approaches still face significant challenges in applicability, scalability, and efficiency. In this work, we propose Retro*, a novel approach for reasoning-intensive document retrieval. Our method introduces a rubric-based relevance scoring mechanism, enabling the model to reason about the relationship between a task and a document based on explicitly defined criteria, whereby producing a fine-grained, interpretable relevance score. Retro* also supports test-time scaling by combining multiple reasoning trajectories via score integration, which produces more reliable relevance estimates. To optimize Retro*'s reasoning capabilities, we introduce a novel reinforcement learning algorithm tailored for its relevance scoring mechanism, which employs two composite rewards to fully exploit the trajectories of each training sample. Our experiments show that Retro* outperforms existing document retrieval methods with notable advantages, leading to state-of-the-art performance on the BRIGHT benchmark.

Ссылки и действия