Actionable Counterfactual Explanations Using Bayesian Networks and Path Planning with Applications to Environmental Quality Improvement

2508.02634v1 cs.AI, cs.LG 2025-08-09
Авторы:

Enrique Valero-Leal, Pedro Larrañaga, Concha Bielza

Резюме на русском

Развитие эффективных методов создания контрфактных объяснений является ключевым заданием в области интерпретируемости машинного обучения. Одной из проблем таких методов является зависимость от актуальных данных, что может повлечь за собой выявление конфиденциальной информации. Авторы предлагают альтернативный подход, основывающийся на использовании байесовских сетей для оценки плотности данных и планировании маршрутов для строительства контрфактных сценариев. Данный подход избегает прямого использования исходных данных, обеспечивая при этом точность и интерпретируемость. Решение проверено на синтетических и реальных данных по оценке качества жизни на уровне американских округов. Оно позволяет более эффективно изучать политики, улучшающие качество жизни, учитывая взаимосвязи между параметрами, такими как экологическое и социодемографическое качество жизни. Работа показывает преимущества этого подхода в обеспечении справедливости и конфиденциальности при принятии решений.

Abstract

Counterfactual explanations study what should have changed in order to get an alternative result, enabling end-users to understand machine learning mechanisms with counterexamples. Actionability is defined as the ability to transform the original case to be explained into a counterfactual one. We develop a method for actionable counterfactual explanations that, unlike predecessors, does not directly leverage training data. Rather, data is only used to learn a density estimator, creating a search landscape in which to apply path planning algorithms to solve the problem and masking the endogenous data, which can be sensitive or private. We put special focus on estimating the data density using Bayesian networks, demonstrating how their enhanced interpretability is useful in high-stakes scenarios in which fairness is raising concern. Using a synthetic benchmark comprised of 15 datasets, our proposal finds more actionable and simpler counterfactuals than the current state-of-the-art algorithms. We also test our algorithm with a real-world Environmental Protection Agency dataset, facilitating a more efficient and equitable study of policies to improve the quality of life in United States of America counties. Our proposal captures the interaction of variables, ensuring equity in decisions, as policies to improve certain domains of study (air, water quality, etc.) can be detrimental in others. In particular, the sociodemographic domain is often involved, where we find important variables related to the ongoing housing crisis that can potentially have a severe negative impact on communities.

Ссылки и действия