Enhancing Technical Documents Retrieval for RAG
2509.04139v1
cs.IR, cs.AI
2025-09-06
Авторы:
Songjiang Lai, Tsun-Hin Cheung, Ka-Chun Fung, Kaiwen Xue, Kwan-Ho Lin, Yan-Ming Choi, Vincent Ng, Kin-Man Lam
Резюме на русском
#### Контекст
Технические документы широко используются в областях инженерии и продуктного развития для поддержки научных исследований, разработки программного обеспечения и конструирования. Однако поиск информации в таких документах часто оказывается сложным из-за того, что пользователи должны уверенно ориентироваться в сложных технических терминах и концепциях. Это приводит к проблемам, таким как неточный поиск, отсутствие полноты и неэффективность в использовании таких документов. Мы предлагаем Technical-Embeddings, подход, оптимизирующий процесс поиска и извлечения смысловой информации из технических документов, чтобы упростить работу с ними и увеличить эффективность разработчиков.
#### Метод
Мы предлагаем новую модель Technical-Embeddings, которая состоит из нескольких шагов:
1. **Расширение запросов пользователя**: Мы расширяем запросы пользователя, используя модели текстовой генерации, чтобы лучше передать их намерения и улучшить широту найденных результатов.
2. **Извлечение кратких сводных выводов**: Мы применяем алгоритмы извлечения кратких сводных выводов для документов, чтобы извлечь ключевую информацию и улучшить точность поиска.
3. **Обучение модели поиска**: Мы используем би-енкодерный модель BERT, которая использует спойлеры для тонкой настройки запросов и документов, чтобы повысить точность и релевантность результатов поиска. Это позволяет модели лучше охватить семантические оттенки в технических документах.
#### Результаты
Мы проводили эксперименты с двумя открытыми наборами данных: RAG-EDA и Rust-Docs-QA. Наши результаты показали, что Technical-Embeddings превышает базовые модели по метрикам precision и recall, что демонстрирует эффективность нашего подхода в поиске технической информации. Мы также обнаружили, что расширение запросов и извлечение сводных выводов действительно повышают точность и релевантность результатов.
#### Значимость
Наш подход может быть использован в различных сферах, таких как инженерия программного обеспечения, техническое проектирование и разработка. Он улучшает доступ к технической информации, позволяя пользователям быстрее находить ответы на свои вопросы. Это может увеличить производительность разработчиков и снизить время, потраченное на поиск информации.
#### Выводы
Мы установили, что наш подход, Technical-Embeddings, значительно улучшает точность и релевантность поиска технических документов. Мы также подтвердили, что расширение запросов и извлечение кратких сводных выводов являются ключевыми компонентами улучшения поиска. В будущем мы планируем расширить модель для поддержки более сложных запросов и улучшить ее эффективность в различных сценариях применения.
Abstract
In this paper, we introduce Technical-Embeddings, a novel framework designed
to optimize semantic retrieval in technical documentation, with applications in
both hardware and software development. Our approach addresses the challenges
of understanding and retrieving complex technical content by leveraging the
capabilities of Large Language Models (LLMs). First, we enhance user queries by
generating expanded representations that better capture user intent and improve
dataset diversity, thereby enriching the fine-tuning process for embedding
models. Second, we apply summary extraction techniques to encode essential
contextual information, refining the representation of technical documents. To
further enhance retrieval performance, we fine-tune a bi-encoder BERT model
using soft prompting, incorporating separate learning parameters for queries
and document context to capture fine-grained semantic nuances. We evaluate our
approach on two public datasets, RAG-EDA and Rust-Docs-QA, demonstrating that
Technical-Embeddings significantly outperforms baseline models in both
precision and recall. Our findings highlight the effectiveness of integrating
query expansion and contextual summarization to enhance information access and
comprehension in technical domains. This work advances the state of
Retrieval-Augmented Generation (RAG) systems, offering new avenues for
efficient and accurate technical document retrieval in engineering and product
development workflows.
Ссылки и действия
Дополнительные ресурсы: