Dynamic Feature Selection based on Rule-based Learning for Explainable Classification with Uncertainty Quantification

2508.02566v1 cs.LG, cs.AI 2025-08-09
Авторы:

Javier Fumanal-Idocin, Raquel Fernandez-Peralta, Javier Andreu-Perez

Резюме на русском

В современных классификационных задачах часто возникает потребность в прозрачности и уточнении принятых решений, особенно в критичных сферах, таких как медицина. Динамическая селекция признаков (DFS) позволяет адаптировать выбор признаков к каждому отдельному случаю, обеспечивая более гибкий и интуитивный подход по сравнению с традиционными статическими методами. Тем не менее, многие DFS-решения оперируют скрытыми моделями, что снижает их значимость в реальных применениях. В данной работе предлагается новая DFS-методика, основанная на правильной системе, что обеспечивает более понятный для пользователя процесс принятия решений. Метод также дает возможность оценивать неопределенность на каждом этапе выбора признаков и сокращает вычислительные затраты за счет ограничения поискового пространства. Авторы показали, что их подход демонстрирует соревновательную производительность по сравнению с градиентными и глубокоучитывающими методами, являющимися более непрозрачными. Это делает DFS-систему правильной более пригодной для использования в реальной жизни, особенно где прозрачность критична.

Abstract

Dynamic feature selection (DFS) offers a compelling alternative to traditional, static feature selection by adapting the selected features to each individual sample. Unlike classical methods that apply a uniform feature set, DFS customizes feature selection per sample, providing insight into the decision-making process for each case. DFS is especially significant in settings where decision transparency is key, i.e., clinical decisions; however, existing methods use opaque models, which hinder their applicability in real-life scenarios. This paper introduces a novel approach leveraging a rule-based system as a base classifier for the DFS process, which enhances decision interpretability compared to neural estimators. We also show how this method provides a quantitative measure of uncertainty for each feature query and can make the feature selection process computationally lighter by constraining the feature search space. We also discuss when greedy selection of conditional mutual information is equivalent to selecting features that minimize the difference with respect to the global model predictions. Finally, we demonstrate the competitive performance of our rule-based DFS approach against established and state-of-the-art greedy and RL methods, which are mostly considered opaque, compared to our explainable rule-based system.

Ссылки и действия