DocVCE: Diffusion-based Visual Counterfactual Explanations for Document Image Classification
2508.04233v1
cs.CV
2025-08-09
Авторы:
Saifullah Saifullah, Stefan Agne, Andreas Dengel, Sheraz Ahmed
Резюме на русском
Непрозрачность AI-систем при принятии решений в обработке документов ограничивает их доверительность, особенно в высокорисковых приложениях, где спутниковые корреляции могут привести к критичным ошибкам. Одна из сложностей в этой области — объяснение решений моделей классификации документовых изображений. До этого момент в качестве объяснений использовались карты важности признаков, но они часто оказываются непонятными и не дают глобального представления обученного модели. В нашей работе мы предлагаем DocVCE — метод, основанный на диффузионных моделях, для генерирования диалогических визуальных контрфактуальных объяснений. Метод работает в два этапа: сначала генерируются визуальные контрфактуальные объяснения, а затем они уточняются с помощью глубокого обучения для поиска ближайшего к исходному изображению валидного контрфактуального. Мы проверили DocVCE на трех датасетах классификации документов (RVL-CDIP, Tobacco3482, DocLayNet) и тремя моделями классификации (ResNet, ConvNeXt, DiT). Мы показали, что DocVCE эффективен в создании понятных и реалистичных контрфактуальных объяснений. Это первая работа, призванная улучшить прозрачность моделей классификации документовых изображений.
Abstract
As black-box AI-driven decision-making systems become increasingly widespread
in modern document processing workflows, improving their transparency and
reliability has become critical, especially in high-stakes applications where
biases or spurious correlations in decision-making could lead to serious
consequences. One vital component often found in such document processing
workflows is document image classification, which, despite its widespread use,
remains difficult to explain. While some recent works have attempted to explain
the decisions of document image classification models through
feature-importance maps, these maps are often difficult to interpret and fail
to provide insights into the global features learned by the model. In this
paper, we aim to bridge this research gap by introducing generative document
counterfactuals that provide meaningful insights into the model's
decision-making through actionable explanations. In particular, we propose
DocVCE, a novel approach that leverages latent diffusion models in combination
with classifier guidance to first generate plausible in-distribution visual
counterfactual explanations, and then performs hierarchical patch-wise
refinement to search for a refined counterfactual that is closest to the target
factual image. We demonstrate the effectiveness of our approach through a
rigorous qualitative and quantitative assessment on 3 different document
classification datasets -- RVL-CDIP, Tobacco3482, and DocLayNet -- and 3
different models -- ResNet, ConvNeXt, and DiT -- using well-established
evaluation criteria such as validity, closeness, and realism. To the best of
the authors' knowledge, this is the first work to explore generative
counterfactual explanations in document image analysis.
Ссылки и действия
Дополнительные ресурсы: