An Information-Flow Perspective on Explainability Requirements: Specification and Verification
2509.01479v1
cs.LO, cs.AI
2025-09-05
Авторы:
Bernd Finkbeiner, Hadar Frenkel, Julian Siber
Резюме на русском
## Контекст
Объяснимость (explainability) систем является важной задачей в многоагентных системах, где агенты должны понимать причины заданных результатов. Объяснение позволяет агентам использовать информацию о причинах поведения системы для принятия более обоснованных решений. Однако объясняемость часто конфликтует с параллельной потребностью в защите приватности. Это создает необходимость в балансировке положительного (объясняемого) и отрицательного (скрываемого) потоков информации. Объясняемые системы должны предоставлять достаточно информации, чтобы агенты могли понять причины действий, но при этом не должны раскрывать личные данные. Это взаимоисключающий конфликт требует структурированного подхода к управлению информационным потоком. Наша методология основывается на использовании эпистемической логики, которая позволяет формализовать требования к объясняемости и поддерживать баланс между этими потоками.
## Метод
Мы используем эпистемическую логику, расширенную для работы с многоагентными системами, для описания и проверки требований к объясняемости. Эта логика позволяет определять информационные требования к системе, позволяющие агентам получить знания о причинах возникшего эффекта. Мы рассматриваем два основных вида информационного потока: положительный (объясняемый) и отрицательный (приватный). Наша методика включает логическую модель, определяющую требования к системе и моделирующую различные сценарии информационного взаимодействия. Мы применяем техники моделирования и алгоритмической проверки для проверки соответствия системы этим требованиям. Это позволяет определить, является ли система объясняемой, и как может быть доработана для соответствия требованиям приватности.
## Результаты
Мы проводили эксперименты с несколькими моделями систем и проверили их на соответствие требованиям объясняемости и приватности. Наши результаты показывают, что наш подход может отличать системы, которые объясняют свои действия, от тех, которые не могут этого делать. Мы также показали, что наш алгоритм может быть использован для формализации дополнительных требований к приватности и их проверки в рамках общей модели. Наши эксперименты демонстрируют, что наша методология позволяет более точно определять, какие системы удовлетворяют требованиям объясняемости, и как они могут быть модифицированы для более эффективного балансирования информационного потока.
## Значимость
Наш подход может применяться в различных областях, где важно обеспечение баланса между объясняемостью и приватностью, таких
Abstract
Explainable systems expose information about why certain observed effects are
happening to the agents interacting with them. We argue that this constitutes a
positive flow of information that needs to be specified, verified, and balanced
against negative information flow that may, e.g., violate privacy guarantees.
Since both explainability and privacy require reasoning about knowledge, we
tackle these tasks with epistemic temporal logic extended with quantification
over counterfactual causes. This allows us to specify that a multi-agent system
exposes enough information such that agents acquire knowledge on why some
effect occurred. We show how this principle can be used to specify
explainability as a system-level requirement and provide an algorithm for
checking finite-state models against such specifications. We present a
prototype implementation of the algorithm and evaluate it on several
benchmarks, illustrating how our approach distinguishes between explainable and
unexplainable systems, and how it allows to pose additional privacy
requirements.
Ссылки и действия
Дополнительные ресурсы: