STRIDE: Subset-Free Functional Decomposition for XAI in Tabular Settings

2509.09070v2 cs.LG, cs.AI, stat.ML 2025-09-16

Авторы:

Chaeyun Ko

Резюме на русском

## Контекст Объяснение решений машинного обучения (eXplainable AI, XAI), особенно в задачах с табулярными данными, представляет собой ключевую проблему в AI. Существующие фреймворки часто ограничены в своей способности показать "как" функции взаимодействуют друг с другом. Это проблема приводит к ситуации, когда пользователи моделей могут понять "что" функции важны, но не понимают "как" они взаимодействуют. Это усложняет понимание моделей и их доверие. Для решения этой проблемы требуется метод, который может эффективно анализировать взаимодействия функций без громоздких вычислений. ## Метод STRIDE (Subset-Free Functional Decomposition) предлагает новую методологию для XAI, основанную на Reproducing Kernel Hilbert Space (RKHS). Он аналитически декомпозирует функциональные компоненты модели, используя рекурсивный процесс центрирования ядер. Этот подход устраняет необходимость в переборе подмножеств (subset enumeration), что приводит к эффективности. Метод является модельно-независимым и опирается на теоретические результаты, такие как гомотетичность и L^2-сходимость. STRIDE также вводит "компонентную хирургию", позволяющую выявлять и измерять вклад отдельных взаимодействий в модель. ## Результаты Эксперименты проводились на 10 табулярных датасетах с повторениями по 10 семантическим семям. STRIDE демонстрирует 3.0-кратный ускорение по сравнению с TreeSHAP в среднем, а также достигает среднего R^2=0.93 для реконструкции, что указывает на высокую точность. Также был проведен эксперимент "компонентная хирургия", демонстрирующий, что удаление одного взаимодействия может значительно изменить значение R^2, что подтверждает эффективность разбора взаимодействий. ## Значимость STRIDE может использоваться в различных областях, где требуется понимание решений моделей, таких как финансы, здравоохранение и агротехника. Метод предоставляет более глубокий взгляд на взаимодействия функций, чем существующие подходы, и позволяет пользователям доверять решениям моделей. Его высокая скорость и точность делают его привлекательным для реального применения. ## Выводы STRIDE предлагает новую архитектуру для XAI, эффективно разбирающую взаимодействия в табулярных моделях без перебора подмножеств. Он показывает свою эффективность в реальных данных и имеет значительный потенциал для улучшения доверия к AI. Будущие работы будут направлены на расширение STRIDE для других типов данных и моделей, а также на повышение его точности и скорости.

Abstract

Most explainable AI (XAI) frameworks are limited in their expressiveness, summarizing complex feature effects as single scalar values \phi_i. This approach answers "what" features are important but fails to reveal "how" they interact. Furthermore, methods that attempt to capture interactions, like those based on Shapley values, often face an exponential computational cost. We present STRIDE, a scalable framework that addresses both limitations by reframing explanation as a subset-enumeration-free, orthogonal "functional decomposition" in a Reproducing Kernel Hilbert Space (RKHS). In the tabular setups we study, STRIDE analytically computes functional components f_S(x_S) via a recursive kernel-centering procedure. The approach is model-agnostic and theoretically grounded with results on orthogonality and L^2 convergence. In tabular benchmarks (10 datasets, median over 10 seeds), STRIDE attains a 3.0 times median speedup over TreeSHAP and a mean R^2=0.93 for reconstruction. We also introduce "component surgery", a diagnostic that isolates a learned interaction and quantifies its contribution; on California Housing, removing a single interaction reduces test R^2 from 0.019 to 0.027.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

STRIDE: Subset-Free Functional Decomposition for XAI in Tabular Settings

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Single-Round Scalable Analytic Federated Learning

Does Flatness imply Generalization for Logistic Loss in Univariate Two-Layer ReL...

Multi-view diffusion geometry using intertwined diffusion trajectories

A Diffusion Model Framework for Maximum Entropy Reinforcement Learning

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainab...

Навигация