RealAC: A Domain-Agnostic Framework for Realistic and Actionable Counterfactual Explanations

2508.10455v1 cs.LG, cs.AI 2025-08-16
Авторы:

Asiful Arefeen, Shovito Barua Soumma, Hassan Ghasemzadeh

Резюме на русском

## Контекст Область исследования сосредоточена на создании удобоваримых и практичных методов генерации каузальных объяснений для моделей машинного обучения. Такие объяснения позволяют пользователю понять причины моделируемых решений, описывая небольшие изменения входных данных, которые могут изменить модельное предсказание. Однако существующие подходы часто строго ограничиваются доменом, явно используя знания о специфике данных, что приводит к ограниченной общительности таких методов. Для повышения доступности и переносимости необходимо создать методы, которые автоматически учитывали бы взаимосвязи между признаками и были применимы к разным областям. Более того, многие имеющиеся системы не учитывают потребности пользователей в гибкости, таких как предпочтения по отношению к неизменяемым атрибутам. Это способствует созданию контрфактических объяснений, которые могут быть непригодными для действий или не реалистичными. Таким образом, в поиске решения этих проблем авторы предлагают создать доменно-независимую систему, которая бы улучшала сбалансированность между реалистичностью и действительностью контрфактических объяснений. ## Метод Разработанный подход, названный RealAC (Realistic and Actionable Counterfactuals), является доменно-независимым фреймворком, который автоматически сохраняет сложные взаимосвязи между признаками без необходимости явного добавления доменной информации. Технический механизм основывается на методах оптимизации, которые согласовывают распределения признаков между фактическим и контрфактическим примерами. Одним из ключевых моментов является возможность пользователя устанавливать "замороженные" признаки, которые не должны изменяться в процессе оптимизации, чтобы учесть ситуации, когда пользователь не может или не желает менять определенные атрибуты. Такой подход обеспечивает более реалистичную и практичную генерацию контрфактических объяснений, учитывающих затруднения пользователей. ## Результаты В работе приводится оценка RealAC на синтетических и реальных данных. Использованы метрики, оценивающие степень реалистичности и действительности контрфактических объяснений. Например, использовались "causal edge score", "dependency preservation score" и "IM1 realism metric". Результаты показали, что RealAC превосходит современные алгоритмы по этим метрикам, обеспечивая более высокий баланс между реалистичностью и действительностью. Также проведено сравнение с LLM-базными методами генерации контрфактических объяснений, в результате чего RealAC показал лучшие результаты. ## Значимость Разработанная система RealAC может быть применена в различных областях, где в

Abstract

Counterfactual explanations provide human-understandable reasoning for AI-made decisions by describing minimal changes to input features that would alter a model's prediction. To be truly useful in practice, such explanations must be realistic and feasible -- they should respect both the underlying data distribution and user-defined feasibility constraints. Existing approaches often enforce inter-feature dependencies through rigid, hand-crafted constraints or domain-specific knowledge, which limits their generalizability and ability to capture complex, nonlinear relations inherent in data. Moreover, they rarely accommodate user-specified preferences and suggest explanations that are causally implausible or infeasible to act upon. We introduce RealAC, a domain-agnostic framework for generating realistic and actionable counterfactuals. RealAC automatically preserves complex inter-feature dependencies without relying on explicit domain knowledge -- by aligning the joint distributions of feature pairs between factual and counterfactual instances. The framework also allows end-users to ``freeze'' attributes they cannot or do not wish to change by suppressing change in frozen features during optimization. Evaluations on three synthetic and two real datasets demonstrate that RealAC balances realism with actionability. Our method outperforms state-of-the-art baselines and Large Language Model-based counterfactual generation techniques in causal edge score, dependency preservation score, and IM1 realism metric and offers a solution for causality-aware and user-centric counterfactual generation.

Ссылки и действия