Towards LLM-generated explanations for Component-based Knowledge Graph Question Answering Systems
2508.14553v1
cs.SE, cs.AI
2025-08-22
Авторы:
Dennis Schiese, Aleksandr Perevalov, Andreas Both
Резюме на русском
## Контекст
В современных сложных системах, таких как QA-системы, развивается сложность, которая затрудняет разработчикам и пользователям понимание и объяснение поведения и решений, принятых этими системами. Эта проблема становится актуальной для компонентных систем QA, в которых AI-методы используются для обработки входных данных и формирования вывода. Используемые методы часто не предоставляют достаточного понимания результатов, что требует дополнительной работы по уточнению и интерпретации. Мотивация для этого исследования — создание прозрачных систем, которые могут объяснить свое поведение. Особенно важно, чтобы такие объяснения были доступны для не специалистов, но и для широкой аудитории, которая может не иметь глубоких технических знаний.
## Метод
Методология исследования основывается на представлении выполнения компонентных систем в виде представления данных, которое включает в себя их входные и выходные данные. В данном случае, входные данные — это SPARQL-запросы, а выходные — RDF-триплы. Для построения объяснений используются два подхода: шаблонный (baseline) и генерируемый с помощью Лёгких Языковых Моделей (LLM). Шаблонный подход предлагает предварительно определенные форматы объяснений, в то время как LLM-подход автоматически формирует понятные и информативные объяснения на основе полученных данных.
## Результаты
На основе экспериментов проводился сравнительный анализ объяснений, полученных с помощью шаблонного подхода и LLM. Шаблонные объяснения были определены вручную и имели ограниченную форматированность, что приводило к недостаткам в понимании. ЛЛМ-подход, напротив, способен формировать более естественные и лаконичные объяснения, которые были лучше оценены пользователями. Заметное преимущество LLM-подхода заключается в том, что он не только упрощает вывод, но и генерирует объяснения, которые лучше соответствуют потребностям пользователей.
## Значимость
Этот подход может быть применен в различных QA-системах для улучшения понимания пользователями результатов выполнения запросов. Он также позволяет улучшить доступность сложных систем для пользователей с разным уровнем знаний. Важное преимущество LLM-подхода — возможность автоматического формирования объяснений, что экономит время и ресурсы. В будущем, это может привести к расширению возможностей объяснения для QA-систем и других AI-систем, чтобы их можно было легко использовать в реальных ситуациях.
## Выводы
Результаты исследования показали, что ЛЛМ-подход представляет собой эффективный способ объяснения поведения компонентных QA-систем. Объяснения, полученные с помощью LLM, показали высокое качество и бы
Abstract
Over time, software systems have reached a level of complexity that makes it
difficult for their developers and users to explain particular decisions made
by them. In this paper, we focus on the explainability of component-based
systems for Question Answering (QA). These components often conduct processes
driven by AI methods, in which behavior and decisions cannot be clearly
explained or justified, s.t., even for QA experts interpreting the executed
process and its results is hard. To address this challenge, we present an
approach that considers the components' input and output data flows as a source
for representing the behavior and provide explanations for the components,
enabling users to comprehend what happened. In the QA framework used here, the
data flows of the components are represented as SPARQL queries (inputs) and RDF
triples (outputs). Hence, we are also providing valuable insights on
verbalization regarding these data types. In our experiments, the approach
generates explanations while following template-based settings (baseline) or
via the use of Large Language Models (LLMs) with different configurations
(automatic generation). Our evaluation shows that the explanations generated
via LLMs achieve high quality and mostly outperform template-based approaches
according to the users' ratings. Therefore, it enables us to automatically
explain the behavior and decisions of QA components to humans while using RDF
and SPARQL as a context for explanations.
Ссылки и действия
Дополнительные ресурсы: