Actionable Counterfactual Explanations Using Bayesian Networks and Path Planning with Applications to Environmental Quality Improvement
2508.02634v1
cs.AI, cs.LG
2025-08-09
Авторы:
Enrique Valero-Leal, Pedro Larrañaga, Concha Bielza
Резюме на русском
Развитие эффективных методов создания контрфактных объяснений является ключевым заданием в области интерпретируемости машинного обучения. Одной из проблем таких методов является зависимость от актуальных данных, что может повлечь за собой выявление конфиденциальной информации. Авторы предлагают альтернативный подход, основывающийся на использовании байесовских сетей для оценки плотности данных и планировании маршрутов для строительства контрфактных сценариев. Данный подход избегает прямого использования исходных данных, обеспечивая при этом точность и интерпретируемость. Решение проверено на синтетических и реальных данных по оценке качества жизни на уровне американских округов. Оно позволяет более эффективно изучать политики, улучшающие качество жизни, учитывая взаимосвязи между параметрами, такими как экологическое и социодемографическое качество жизни. Работа показывает преимущества этого подхода в обеспечении справедливости и конфиденциальности при принятии решений.
Abstract
Counterfactual explanations study what should have changed in order to get an
alternative result, enabling end-users to understand machine learning
mechanisms with counterexamples. Actionability is defined as the ability to
transform the original case to be explained into a counterfactual one. We
develop a method for actionable counterfactual explanations that, unlike
predecessors, does not directly leverage training data. Rather, data is only
used to learn a density estimator, creating a search landscape in which to
apply path planning algorithms to solve the problem and masking the endogenous
data, which can be sensitive or private. We put special focus on estimating the
data density using Bayesian networks, demonstrating how their enhanced
interpretability is useful in high-stakes scenarios in which fairness is
raising concern. Using a synthetic benchmark comprised of 15 datasets, our
proposal finds more actionable and simpler counterfactuals than the current
state-of-the-art algorithms. We also test our algorithm with a real-world
Environmental Protection Agency dataset, facilitating a more efficient and
equitable study of policies to improve the quality of life in United States of
America counties. Our proposal captures the interaction of variables, ensuring
equity in decisions, as policies to improve certain domains of study (air,
water quality, etc.) can be detrimental in others. In particular, the
sociodemographic domain is often involved, where we find important variables
related to the ongoing housing crisis that can potentially have a severe
negative impact on communities.
Ссылки и действия
Дополнительные ресурсы: