Causal SHAP: Feature Attribution with Dependency Awareness through Causal Discovery
2509.00846v1
cs.LG, cs.AI, stat.ME
2025-09-05
Авторы:
Woon Yee Ng, Li Rong Wang, Siyuan Liu, Xiuyi Fan
Резюме на русском
## Контекст
Машинное обучение (ML) применяется все чаще в высокорисковых областях, таких как здравоохранение и финансы, где точность и прозрачность моделей критически важны. Одна из самых популярных методик для объяснения предсказаний ML является SHapley Additive exPlanations (SHAP). Однако SHAP не учитывает связи причинно-следственные (causal relationships), что может привести к неточностям в задании причинно-следственных связей и ошибаться при присвоении веса признаков. Эти недостатки могут привести к качественно низким результатам в ситуациях, когда признаки сильно коррелируют. Из-за этого возникает необходимость в развитии новых алгоритмов, которые бы учитывали причинно-следственные связи и улучшали точность и целесообразность функций причины в моделях ML.
## Метод
Causal SHAP — это расширенная форма SHAP, которая интегрирует причинно-следственные связи с использованием метода Peter-Clark (PC) для выявления причинных связей и алгоритма Intervention Calculus when the DAG is Absent (IDA) для определения силы причинных связей. Метод работает следующим образом: для каждого признака вычисляется степень вклада в результат модели, при этом признаки, лишь коррелирующие с целевым параметром, получают низкие оценки причинности. Этот подход позволяет уменьшить чрезмерную принадлежность коррелирующих признаков в анализе и повысить точность причинно-следственных оценок.
## Результаты
Для оценки эффективности Causal SHAP были проведены эксперименты на виртуальных и реальных данных. На выборке синтетических данных, где были сильно связаны признаки, Causal SHAP показал значительное улучшение сравнения с SHAP в точности причинно-следственных оценок. Аналогичные эксперименты на реальных данных, таких как данные из медицины, подтвердили эффективность нового подхода в формировании более точных причинных оценок признаков. Полученные результаты показали, что Causal SHAP дает более точное понимание причинно-следственных связей, которое может быть критично в сложных научных и практических задачах.
## Значимость
Causal SHAP может быть применен в сферах, где важно понимать причинно-следственные связи, например, в здравоохранении, финансах и маркетинге. Он предоставляет более точные интерпретации, уменьшая риск ошибок при присвоении веса признаков. Эта улучшенная поддержка причинно-следственных связей может привести к более уверенным и информативным решениям в высокорисковых областях.
## Выводы
Causal SHAP является более точным способом присвоения веса признаков, учитывающим причинно-следственные связи. Мы показали, что этот подход эффективен в различных ситуациях и может стать полезным инструментом для XAI. В будущем, мы планируем расширить Causal SHAP для более сложных
Abstract
Explaining machine learning (ML) predictions has become crucial as ML models
are increasingly deployed in high-stakes domains such as healthcare. While
SHapley Additive exPlanations (SHAP) is widely used for model interpretability,
it fails to differentiate between causality and correlation, often
misattributing feature importance when features are highly correlated. We
propose Causal SHAP, a novel framework that integrates causal relationships
into feature attribution while preserving many desirable properties of SHAP. By
combining the Peter-Clark (PC) algorithm for causal discovery and the
Intervention Calculus when the DAG is Absent (IDA) algorithm for causal
strength quantification, our approach addresses the weakness of SHAP.
Specifically, Causal SHAP reduces attribution scores for features that are
merely correlated with the target, as validated through experiments on both
synthetic and real-world datasets. This study contributes to the field of
Explainable AI (XAI) by providing a practical framework for causal-aware model
explanations. Our approach is particularly valuable in domains such as
healthcare, where understanding true causal relationships is critical for
informed decision-making.
Ссылки и действия
Дополнительные ресурсы: