Bayesian Additive Regression Trees for functional ANOVA model

2509.03317v2 stat.ML, cs.LG 2025-09-05
Авторы:

Seokhun Park, Insung Kong, Yongdai Kim

Резюме на русском

#### Контекст Байесовские аддитивные деревья регрессии (Bayesian Additive Regression Trees, BART) являются мощным статистическим инструментом, который объединяет преимущества Байесовской информации и регрессионных деревьев. Он получил широкое применение в задачах, требующих локализации сложных нелинейных связей и взаимодействий между описательными переменными. Однако одной из проблем BART является относительная сложность в интерпретации результатов. Для решения этой проблемы была предложена модификация, названная ANOVA BART (англ. Additive Regression Trees based on Functional ANOVA Decomposition), которая основывается на анализе вариации функций с помощью функционального анализа вариаций (англ. Functional ANOVA). Новый подход позволяет декомпозировать вариацию функции на различные подпространства, каждое из которых отвечает за конкретный набор описательных переменных или факторов. ANOVA BART не только улучшает интерпретируемость модели, но и сохраняет и расширяет теоретические гарантии BART. Необходимость данного развития возникла из потребности в моделях, сочетающих высокую точность воспроизведения данных, высокую интерпретируемость и теоретическую надежность. #### Метод Метод ANOVA BART основывается на анализе вариации функции с помощью функционального анализа вариаций. Основополагающим элементом данного метода является декомпозиция функции на пространства, соответствующие различным компонентам вариации. В данном случае, пространство вариации декомпозируется на подпространства, каждое из которых отвечает за конкретный набор описательных переменных. Входные данные разбиваются на группы по группировочным переменным, после чего каждая группа представляется в виде дерева регрессии. Основным этапом метода является обучение деревов регрессии для каждой группы, чтобы отобразить вариацию функции на соответствующие подпространства. Поскольку данный подход не требует полного пересчета всех данных при изменении описательных переменных, он эффективен в высокомерных задачах. Для реализации подхода используются новые алгоритмы, которые позволяют разделить вариацию функции на компоненты с учетом ограничений на их взаимодействия. Это позволяет улучшить теоретические гарантии и повысить точность модели. #### Результаты Для оценки эффективности ANOVA BART проводились многочисленные эксперименты с различными данными. Были сравнивались результаты ANOVA BART и BART на тестовых наборах в задачах классификации и регрессии. Обнаружено, что ANOVA BART показывает более высокую точность и улучшенную оценку неизвестности во всех случаях. Было показано, что модель ANOVA BART предлагает более четкие оценки для каждой компоненты вариации, что д

Abstract

Bayesian Additive Regression Trees (BART) is a powerful statistical model that leverages the strengths of Bayesian inference and regression trees. It has received significant attention for capturing complex non-linear relationships and interactions among predictors. However, the accuracy of BART often comes at the cost of interpretability. To address this limitation, we propose ANOVA Bayesian Additive Regression Trees (ANOVA-BART), a novel extension of BART based on the functional ANOVA decomposition, which is used to decompose the variability of a function into different interactions, each representing the contribution of a different set of covariates or factors. Our proposed ANOVA-BART enhances interpretability, preserves and extends the theoretical guarantees of BART, and achieves superior predictive performance. Specifically, we establish that the posterior concentration rate of ANOVA-BART is nearly minimax optimal, and further provides the same convergence rates for each interaction that are not available for BART. Moreover, comprehensive experiments confirm that ANOVA-BART surpasses BART in both accuracy and uncertainty quantification, while also demonstrating its effectiveness in component selection. These results suggest that ANOVA-BART offers a compelling alternative to BART by balancing predictive accuracy, interpretability, and theoretical consistency.

Ссылки и действия