RealAC: A Domain-Agnostic Framework for Realistic and Actionable Counterfactual Explanations
2508.10455v1
cs.LG, cs.AI
2025-08-16
Авторы:
Asiful Arefeen, Shovito Barua Soumma, Hassan Ghasemzadeh
Резюме на русском
## Контекст
Область исследования сосредоточена на создании удобоваримых и практичных методов генерации каузальных объяснений для моделей машинного обучения. Такие объяснения позволяют пользователю понять причины моделируемых решений, описывая небольшие изменения входных данных, которые могут изменить модельное предсказание. Однако существующие подходы часто строго ограничиваются доменом, явно используя знания о специфике данных, что приводит к ограниченной общительности таких методов. Для повышения доступности и переносимости необходимо создать методы, которые автоматически учитывали бы взаимосвязи между признаками и были применимы к разным областям. Более того, многие имеющиеся системы не учитывают потребности пользователей в гибкости, таких как предпочтения по отношению к неизменяемым атрибутам. Это способствует созданию контрфактических объяснений, которые могут быть непригодными для действий или не реалистичными. Таким образом, в поиске решения этих проблем авторы предлагают создать доменно-независимую систему, которая бы улучшала сбалансированность между реалистичностью и действительностью контрфактических объяснений.
## Метод
Разработанный подход, названный RealAC (Realistic and Actionable Counterfactuals), является доменно-независимым фреймворком, который автоматически сохраняет сложные взаимосвязи между признаками без необходимости явного добавления доменной информации. Технический механизм основывается на методах оптимизации, которые согласовывают распределения признаков между фактическим и контрфактическим примерами. Одним из ключевых моментов является возможность пользователя устанавливать "замороженные" признаки, которые не должны изменяться в процессе оптимизации, чтобы учесть ситуации, когда пользователь не может или не желает менять определенные атрибуты. Такой подход обеспечивает более реалистичную и практичную генерацию контрфактических объяснений, учитывающих затруднения пользователей.
## Результаты
В работе приводится оценка RealAC на синтетических и реальных данных. Использованы метрики, оценивающие степень реалистичности и действительности контрфактических объяснений. Например, использовались "causal edge score", "dependency preservation score" и "IM1 realism metric". Результаты показали, что RealAC превосходит современные алгоритмы по этим метрикам, обеспечивая более высокий баланс между реалистичностью и действительностью. Также проведено сравнение с LLM-базными методами генерации контрфактических объяснений, в результате чего RealAC показал лучшие результаты.
## Значимость
Разработанная система RealAC может быть применена в различных областях, где в
Abstract
Counterfactual explanations provide human-understandable reasoning for
AI-made decisions by describing minimal changes to input features that would
alter a model's prediction. To be truly useful in practice, such explanations
must be realistic and feasible -- they should respect both the underlying data
distribution and user-defined feasibility constraints. Existing approaches
often enforce inter-feature dependencies through rigid, hand-crafted
constraints or domain-specific knowledge, which limits their generalizability
and ability to capture complex, nonlinear relations inherent in data. Moreover,
they rarely accommodate user-specified preferences and suggest explanations
that are causally implausible or infeasible to act upon. We introduce RealAC, a
domain-agnostic framework for generating realistic and actionable
counterfactuals. RealAC automatically preserves complex inter-feature
dependencies without relying on explicit domain knowledge -- by aligning the
joint distributions of feature pairs between factual and counterfactual
instances. The framework also allows end-users to ``freeze'' attributes they
cannot or do not wish to change by suppressing change in frozen features during
optimization. Evaluations on three synthetic and two real datasets demonstrate
that RealAC balances realism with actionability. Our method outperforms
state-of-the-art baselines and Large Language Model-based counterfactual
generation techniques in causal edge score, dependency preservation score, and
IM1 realism metric and offers a solution for causality-aware and user-centric
counterfactual generation.
Ссылки и действия
Дополнительные ресурсы: