RAGuard: A Novel Approach for in-context Safe Retrieval Augmented Generation for LLMs

2509.03768v1 cs.AI, stat.ML 2025-09-06

Авторы:

Connor Walker, Koorosh Aslansefat, Mohammad Naveed Akram, Yiannis Papadopoulos

Резюме на русском

## Контекст Оффшорные ветроэнергетические станции являются критически важной частью современной энергетической системы. Однако их эффективное обслуживание и обслуживание требуют высокой точности и надежности, в том числе при работе с ситуациями, требующими специализированных знаний. Большинство существующих БоLargе Language Models (LLMs) не справляются с такими специфичными ситуациями, особенно когда речь идет о безопасности и контекстной актуальности. Это приводит к потенциальным ошибкам, которые могут привести к катастрофическим последствиям. Мотивирует это место внимания не только на технической, но и на безопасности, особенно в критически важных областях. ## Метод RAGuard представляет собой расширенную систему Retrieval-Augmented Generation (RAG), которая активно интегрирует специализированные документы по безопасности вместе с техническими материалами. Оно использует две отдельные индексации — для знаний и для безопасности — и выпускает две параллельные запросы, чтобы обеспечить глубокий технический анализ и гарантию безопасности. Для усиления безопасности вводится SafetyClamp, который расширяет поисковый запрос, "жестко фиксируя" гарантии безопасности в результате поиска. Такая архитектура обеспечивает комплексный подход к обеспечению технической и безопасности в критически важных задачах. ## Результаты Проведенные эксперименты показали, что RAGuard значительно повышает безопасность и точность в сравнении с традиционными RAG-системами. Например, Safety Recall@K, который изначально составлял почти 0% в традиционных RAG-системах, вырос до более чем 50% при использовании RAGuard, при этом Technical Recall@K оставался выше 60%. Эти результаты демонстрируют, что RAGuard и SafetyClamp могут стать новым стандартом для интеграции безопасности в LLM-системы, особенно в критически важных областях, таких как обслуживание ветроэнергетических станций. ## Значимость RAGuard может быть применено в критически важных сферах, где безопасность и точность являются ключевыми. Это включает не только ветроэнергетику, но и другие критически важные области, такие как генетические исследования, медицина или финансы. Преимущества RAGuard заключаются в его способности обеспечивать верифицированные, широко охватывающие результаты, что уменьшает риск ошибок и повышает надежность. Его потенциал включает в себя создание более безопасных, эффективных и контекстно-зависимых решений для широкого круга приложений. ## Выводы Результаты показывают, что RAGuard является эффективным решением для обеспечения безопасности и точности в LLM

Abstract

Accuracy and safety are paramount in Offshore Wind (OSW) maintenance, yet conventional Large Language Models (LLMs) often fail when confronted with highly specialised or unexpected scenarios. We introduce RAGuard, an enhanced Retrieval-Augmented Generation (RAG) framework that explicitly integrates safety-critical documents alongside technical manuals.By issuing parallel queries to two indices and allocating separate retrieval budgets for knowledge and safety, RAGuard guarantees both technical depth and safety coverage. We further develop a SafetyClamp extension that fetches a larger candidate pool, "hard-clamping" exact slot guarantees to safety. We evaluate across sparse (BM25), dense (Dense Passage Retrieval) and hybrid retrieval paradigms, measuring Technical Recall@K and Safety Recall@K. Both proposed extensions of RAG show an increase in Safety Recall@K from almost 0\% in RAG to more than 50\% in RAGuard, while maintaining Technical Recall above 60\%. These results demonstrate that RAGuard and SafetyClamp have the potential to establish a new standard for integrating safety assurance into LLM-powered decision support in critical maintenance contexts.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

RAGuard: A Novel Approach for in-context Safe Retrieval Augmented Generation for LLMs

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

A Selective Temporal Hamming distance to find patterns in state transition event...

DAPS++: Rethinking Diffusion Inverse Problems with Decoupled Posterior Annealing

Potential Outcome Rankings for Counterfactual Decision Making

LLM enhanced graph inference for long-term disease progression modelling

Integrating Bayesian methods with neural network--based model predictive control...

Навигация