Enhancing Technical Documents Retrieval for RAG

2509.04139v1 cs.IR, cs.AI 2025-09-06
Авторы:

Songjiang Lai, Tsun-Hin Cheung, Ka-Chun Fung, Kaiwen Xue, Kwan-Ho Lin, Yan-Ming Choi, Vincent Ng, Kin-Man Lam

Резюме на русском

#### Контекст Технические документы широко используются в областях инженерии и продуктного развития для поддержки научных исследований, разработки программного обеспечения и конструирования. Однако поиск информации в таких документах часто оказывается сложным из-за того, что пользователи должны уверенно ориентироваться в сложных технических терминах и концепциях. Это приводит к проблемам, таким как неточный поиск, отсутствие полноты и неэффективность в использовании таких документов. Мы предлагаем Technical-Embeddings, подход, оптимизирующий процесс поиска и извлечения смысловой информации из технических документов, чтобы упростить работу с ними и увеличить эффективность разработчиков. #### Метод Мы предлагаем новую модель Technical-Embeddings, которая состоит из нескольких шагов: 1. **Расширение запросов пользователя**: Мы расширяем запросы пользователя, используя модели текстовой генерации, чтобы лучше передать их намерения и улучшить широту найденных результатов. 2. **Извлечение кратких сводных выводов**: Мы применяем алгоритмы извлечения кратких сводных выводов для документов, чтобы извлечь ключевую информацию и улучшить точность поиска. 3. **Обучение модели поиска**: Мы используем би-енкодерный модель BERT, которая использует спойлеры для тонкой настройки запросов и документов, чтобы повысить точность и релевантность результатов поиска. Это позволяет модели лучше охватить семантические оттенки в технических документах. #### Результаты Мы проводили эксперименты с двумя открытыми наборами данных: RAG-EDA и Rust-Docs-QA. Наши результаты показали, что Technical-Embeddings превышает базовые модели по метрикам precision и recall, что демонстрирует эффективность нашего подхода в поиске технической информации. Мы также обнаружили, что расширение запросов и извлечение сводных выводов действительно повышают точность и релевантность результатов. #### Значимость Наш подход может быть использован в различных сферах, таких как инженерия программного обеспечения, техническое проектирование и разработка. Он улучшает доступ к технической информации, позволяя пользователям быстрее находить ответы на свои вопросы. Это может увеличить производительность разработчиков и снизить время, потраченное на поиск информации. #### Выводы Мы установили, что наш подход, Technical-Embeddings, значительно улучшает точность и релевантность поиска технических документов. Мы также подтвердили, что расширение запросов и извлечение кратких сводных выводов являются ключевыми компонентами улучшения поиска. В будущем мы планируем расширить модель для поддержки более сложных запросов и улучшить ее эффективность в различных сценариях применения.

Abstract

In this paper, we introduce Technical-Embeddings, a novel framework designed to optimize semantic retrieval in technical documentation, with applications in both hardware and software development. Our approach addresses the challenges of understanding and retrieving complex technical content by leveraging the capabilities of Large Language Models (LLMs). First, we enhance user queries by generating expanded representations that better capture user intent and improve dataset diversity, thereby enriching the fine-tuning process for embedding models. Second, we apply summary extraction techniques to encode essential contextual information, refining the representation of technical documents. To further enhance retrieval performance, we fine-tune a bi-encoder BERT model using soft prompting, incorporating separate learning parameters for queries and document context to capture fine-grained semantic nuances. We evaluate our approach on two public datasets, RAG-EDA and Rust-Docs-QA, demonstrating that Technical-Embeddings significantly outperforms baseline models in both precision and recall. Our findings highlight the effectiveness of integrating query expansion and contextual summarization to enhance information access and comprehension in technical domains. This work advances the state of Retrieval-Augmented Generation (RAG) systems, offering new avenues for efficient and accurate technical document retrieval in engineering and product development workflows.

Ссылки и действия