Retro*: Optimizing LLMs for Reasoning-Intensive Document Retrieval
2509.24869v1
cs.IR, cs.AI, cs.CL
2025-10-01
Авторы:
Junwei Lan, Jianlyu Chen, Zheng Liu, Chaofan Li, Siqi Bao, Defu Lian
Резюме на русском
#### Контекст
Современные глубоко обученные языковые модели (LLM) позволяют решать сложные задачи, включая документ-регрессию (RAG), где необходимо выявлять информацию из документов для решения задач. Однако возникает проблема точной оценки связи между задачей и кандидатскими документами, особенно когда эта связь не является явной. Это создает серьезные обрестки для существующих методов информационного поиска (IR). Недостаток точности и эффективности в оценке связи приводит к неверным выводам и неэффективности в использовании ресурсов. Таким образом, нужна новая методология, которая бы учитывала тонкую логику при оценивании документов и повышала производительность в целом.
#### Метод
Мы предлагаем Retro*, новую систему для решения документ-регрессии, основанную на рейтинге согласно четко определенным критериям. Метод включает в себя следующие элементы:
1. **Рубрика-ориентированная оценка релевантности**: Retro* использует формальные критерии для оценки того, насколько документ отвечает требованиям задачи. Это позволяет получить развернутую интерпретируемую оценку релевантности.
2. **Множественные пути рассуждения**: Метод поддерживает тестирование, объединяя несколько логических траекторий в единый балл релевантности, что повышает точность оценки.
3. **Оптимизация через RL**: Мы предлагаем усовершенствованный алгоритм, который использует два композитных признака для оценки каждого образца во время тренировки.
Эти черты обеспечивают глубокую работу с логическими задачами и эффективность в применении.
#### Результаты
Мы проверили Retro* на BRIGHT benchmark, что позволило сравнить его с другими существующими методами. Результаты показали, что Retro* показывает значительное превосходство в долготерминальной точности и эффективности. Таким образом, Retro* демонстрирует новую стандартную систему по работе с документ-регрессией, показывая выдающиеся результаты в сложных сценариях с малой или неявной связью между задачей и документом.
#### Значимость
Предложенная система может использоваться в различных областях, где требуется точная интерпретация документов, например, в здравоохранении, в системах поддержки решений и в системах управления бизнес-данными. В отличие от существующих подходов, Retro* обеспечивает:
- **Точность**: Оценка релевантности с более высоким уровнем точности.
- **Производительность**: Высокая скорость и эффективность при работе с большими объемами данных.
- **Скейлинг**: Может работать в различных условиях с ресурсоемкими задачами.
#### Выводы
Retro* представляет собой совершенно новый подход к до
Abstract
With the growing popularity of LLM agents and RAG, it has become increasingly
important to retrieve documents that are essential for solving a task, even
when their connection to the task is indirect or implicit. Addressing this
problem requires fine-grained reasoning to accurately assess the relevance
between the task and each candidate document. This capability, however, poses a
significant challenge for existing IR techniques. Despite recent progress in
reasoning-enhanced IR, existing approaches still face significant challenges in
applicability, scalability, and efficiency. In this work, we propose Retro*, a
novel approach for reasoning-intensive document retrieval. Our method
introduces a rubric-based relevance scoring mechanism, enabling the model to
reason about the relationship between a task and a document based on explicitly
defined criteria, whereby producing a fine-grained, interpretable relevance
score. Retro* also supports test-time scaling by combining multiple reasoning
trajectories via score integration, which produces more reliable relevance
estimates. To optimize Retro*'s reasoning capabilities, we introduce a novel
reinforcement learning algorithm tailored for its relevance scoring mechanism,
which employs two composite rewards to fully exploit the trajectories of each
training sample. Our experiments show that Retro* outperforms existing document
retrieval methods with notable advantages, leading to state-of-the-art
performance on the BRIGHT benchmark.
Ссылки и действия
Дополнительные ресурсы: