Conflict-Aware Soft Prompting for Retrieval-Augmented Generation

2508.15253v1 cs.CL, cs.AI 2025-08-23

Авторы:

Eunseong Choi, June Park, Hyeri Lee, Jongwuk Lee

Резюме на русском

## Контекст Retrieval-augmented generation (RAG) является важной компонентой современных моделей естественного языка. Она улучшает возможности бо LARGE LANGUAGE MODELS (LLM), интегрируя внешнюю знания в их входные запросы. Однако, RAG может столкнуться с конфликтом между внешней контекстной информацией и внутренними параметрами модели. Этот конфликт, известный как context-memory conflict, возникает когда внешний контекст, полученный из внешних источников, противоречит существующим внутренним параметрам модели. Эта проблема снижает точность и надежность RAG-систем. Мотивация для данного исследования лежит в области уменьшения таких конфликтов и повышения надежности RAG-систем, что является ключевым для применения моделей в реальных сценариях. ## Метод Для решения проблемы context-memory conflict предлагается Conflict-Aware REtrieval-Augmented Generation (CARE), которая состоит из двух основных компонентов: context assessor и base LLM. Context assessor отвечает за извлечение и обработку контекстных токенов, а также для оценки надежности внешнего контекста. Он использует методы grounded/adversarial soft prompting, которые позволяют выделить сигналы, направляющие модель к более надежным источникам. Эта архитектура позволяет CARE эффективно устранять конфликт между внешним контекстом и внутренними параметрами LLM. Такой подход гарантирует точность и надежность модели в работе с противоречивыми данными. ## Результаты Результаты экспериментов показывают, что CARE эффективно решает проблему context-memory conflict. Она была протестирована на нескольких бенчмарках, включая задачи типа question answering (QA) и fact-checking. Эксперименты показали средний прирост точности на 5.0% по сравнению с базовыми RAG-системами. Этот результат указывает на то, что CARE может эффективно устранять конфликты внешнего контекста и внутренних параметров, улучшая надежность и точность RAG-систем. Это делает CARE применимой в реальных сценариях, где точность и надежность критичны. ## Значимость CARE может быть применена в различных областях, где необходима надежная и точная RAG-система. Ее возможность решать конфликты внешнего контекста и внутренних параметров делает ее идеальной для применения в сферах, где верная информация критична, таких как системы поддержки решений, медицинские модели и юридические системы. Благодаря своей возможности обеспечивать более надежные и точные ответы, CARE может существенно повысить доверие к RAG-системам и улучшить их применимость в реальных сценариях. ## Выводы В результате исследования был предложен Conflict-Aware REtrieval-Augmented Generation (CARE), которая эффективно решает проблему context-memory conflict в RAG-системах. CARE показала существенный прирост точности в задачах QA и fact-checking, устанавливая новый высокий стандарт для надежности и точности RAG-систем. Б

Abstract

Retrieval-augmented generation (RAG) enhances the capabilities of large language models (LLMs) by incorporating external knowledge into their input prompts. However, when the retrieved context contradicts the LLM's parametric knowledge, it often fails to resolve the conflict between incorrect external context and correct parametric knowledge, known as context-memory conflict. To tackle this problem, we introduce Conflict-Aware REtrieval-Augmented Generation (CARE), consisting of a context assessor and a base LLM. The context assessor encodes compact memory token embeddings from raw context tokens. Through grounded/adversarial soft prompting, the context assessor is trained to discern unreliable context and capture a guidance signal that directs reasoning toward the more reliable knowledge source. Extensive experiments show that CARE effectively mitigates context-memory conflicts, leading to an average performance gain of 5.0\% on QA and fact-checking benchmarks, establishing a promising direction for trustworthy and adaptive RAG systems.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Conflict-Aware Soft Prompting for Retrieval-Augmented Generation

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

UW-BioNLP at ChemoTimelines 2025: Thinking, Fine-Tuning, and Dictionary-Enhanced...

AdmTree: Compressing Lengthy Context with Adaptive Semantic Trees

SignRoundV2: Closing the Performance Gap in Extremely Low-Bit Post-Training Quan...

Mitigating Catastrophic Forgetting in Target Language Adaptation of LLMs via Sou...

SEAL: Self-Evolving Agentic Learning for Conversational Question Answering over ...

Навигация