Towards LLM-generated explanations for Component-based Knowledge Graph Question Answering Systems

2508.14553v1 cs.SE, cs.AI 2025-08-22
Авторы:

Dennis Schiese, Aleksandr Perevalov, Andreas Both

Резюме на русском

## Контекст В современных сложных системах, таких как QA-системы, развивается сложность, которая затрудняет разработчикам и пользователям понимание и объяснение поведения и решений, принятых этими системами. Эта проблема становится актуальной для компонентных систем QA, в которых AI-методы используются для обработки входных данных и формирования вывода. Используемые методы часто не предоставляют достаточного понимания результатов, что требует дополнительной работы по уточнению и интерпретации. Мотивация для этого исследования — создание прозрачных систем, которые могут объяснить свое поведение. Особенно важно, чтобы такие объяснения были доступны для не специалистов, но и для широкой аудитории, которая может не иметь глубоких технических знаний. ## Метод Методология исследования основывается на представлении выполнения компонентных систем в виде представления данных, которое включает в себя их входные и выходные данные. В данном случае, входные данные — это SPARQL-запросы, а выходные — RDF-триплы. Для построения объяснений используются два подхода: шаблонный (baseline) и генерируемый с помощью Лёгких Языковых Моделей (LLM). Шаблонный подход предлагает предварительно определенные форматы объяснений, в то время как LLM-подход автоматически формирует понятные и информативные объяснения на основе полученных данных. ## Результаты На основе экспериментов проводился сравнительный анализ объяснений, полученных с помощью шаблонного подхода и LLM. Шаблонные объяснения были определены вручную и имели ограниченную форматированность, что приводило к недостаткам в понимании. ЛЛМ-подход, напротив, способен формировать более естественные и лаконичные объяснения, которые были лучше оценены пользователями. Заметное преимущество LLM-подхода заключается в том, что он не только упрощает вывод, но и генерирует объяснения, которые лучше соответствуют потребностям пользователей. ## Значимость Этот подход может быть применен в различных QA-системах для улучшения понимания пользователями результатов выполнения запросов. Он также позволяет улучшить доступность сложных систем для пользователей с разным уровнем знаний. Важное преимущество LLM-подхода — возможность автоматического формирования объяснений, что экономит время и ресурсы. В будущем, это может привести к расширению возможностей объяснения для QA-систем и других AI-систем, чтобы их можно было легко использовать в реальных ситуациях. ## Выводы Результаты исследования показали, что ЛЛМ-подход представляет собой эффективный способ объяснения поведения компонентных QA-систем. Объяснения, полученные с помощью LLM, показали высокое качество и бы

Abstract

Over time, software systems have reached a level of complexity that makes it difficult for their developers and users to explain particular decisions made by them. In this paper, we focus on the explainability of component-based systems for Question Answering (QA). These components often conduct processes driven by AI methods, in which behavior and decisions cannot be clearly explained or justified, s.t., even for QA experts interpreting the executed process and its results is hard. To address this challenge, we present an approach that considers the components' input and output data flows as a source for representing the behavior and provide explanations for the components, enabling users to comprehend what happened. In the QA framework used here, the data flows of the components are represented as SPARQL queries (inputs) and RDF triples (outputs). Hence, we are also providing valuable insights on verbalization regarding these data types. In our experiments, the approach generates explanations while following template-based settings (baseline) or via the use of Large Language Models (LLMs) with different configurations (automatic generation). Our evaluation shows that the explanations generated via LLMs achieve high quality and mostly outperform template-based approaches according to the users' ratings. Therefore, it enables us to automatically explain the behavior and decisions of QA components to humans while using RDF and SPARQL as a context for explanations.

Ссылки и действия