An Information-Flow Perspective on Explainability Requirements: Specification and Verification

2509.01479v1 cs.LO, cs.AI 2025-09-05
Авторы:

Bernd Finkbeiner, Hadar Frenkel, Julian Siber

Резюме на русском

## Контекст Объяснимость (explainability) систем является важной задачей в многоагентных системах, где агенты должны понимать причины заданных результатов. Объяснение позволяет агентам использовать информацию о причинах поведения системы для принятия более обоснованных решений. Однако объясняемость часто конфликтует с параллельной потребностью в защите приватности. Это создает необходимость в балансировке положительного (объясняемого) и отрицательного (скрываемого) потоков информации. Объясняемые системы должны предоставлять достаточно информации, чтобы агенты могли понять причины действий, но при этом не должны раскрывать личные данные. Это взаимоисключающий конфликт требует структурированного подхода к управлению информационным потоком. Наша методология основывается на использовании эпистемической логики, которая позволяет формализовать требования к объясняемости и поддерживать баланс между этими потоками. ## Метод Мы используем эпистемическую логику, расширенную для работы с многоагентными системами, для описания и проверки требований к объясняемости. Эта логика позволяет определять информационные требования к системе, позволяющие агентам получить знания о причинах возникшего эффекта. Мы рассматриваем два основных вида информационного потока: положительный (объясняемый) и отрицательный (приватный). Наша методика включает логическую модель, определяющую требования к системе и моделирующую различные сценарии информационного взаимодействия. Мы применяем техники моделирования и алгоритмической проверки для проверки соответствия системы этим требованиям. Это позволяет определить, является ли система объясняемой, и как может быть доработана для соответствия требованиям приватности. ## Результаты Мы проводили эксперименты с несколькими моделями систем и проверили их на соответствие требованиям объясняемости и приватности. Наши результаты показывают, что наш подход может отличать системы, которые объясняют свои действия, от тех, которые не могут этого делать. Мы также показали, что наш алгоритм может быть использован для формализации дополнительных требований к приватности и их проверки в рамках общей модели. Наши эксперименты демонстрируют, что наша методология позволяет более точно определять, какие системы удовлетворяют требованиям объясняемости, и как они могут быть модифицированы для более эффективного балансирования информационного потока. ## Значимость Наш подход может применяться в различных областях, где важно обеспечение баланса между объясняемостью и приватностью, таких

Abstract

Explainable systems expose information about why certain observed effects are happening to the agents interacting with them. We argue that this constitutes a positive flow of information that needs to be specified, verified, and balanced against negative information flow that may, e.g., violate privacy guarantees. Since both explainability and privacy require reasoning about knowledge, we tackle these tasks with epistemic temporal logic extended with quantification over counterfactual causes. This allows us to specify that a multi-agent system exposes enough information such that agents acquire knowledge on why some effect occurred. We show how this principle can be used to specify explainability as a system-level requirement and provide an algorithm for checking finite-state models against such specifications. We present a prototype implementation of the algorithm and evaluate it on several benchmarks, illustrating how our approach distinguishes between explainable and unexplainable systems, and how it allows to pose additional privacy requirements.

Ссылки и действия