Bayesian Additive Regression Trees for functional ANOVA model
2509.03317v2
stat.ML, cs.LG
2025-09-05
Авторы:
Seokhun Park, Insung Kong, Yongdai Kim
Резюме на русском
#### Контекст
Байесовские аддитивные деревья регрессии (Bayesian Additive Regression Trees, BART) являются мощным статистическим инструментом, который объединяет преимущества Байесовской информации и регрессионных деревьев. Он получил широкое применение в задачах, требующих локализации сложных нелинейных связей и взаимодействий между описательными переменными. Однако одной из проблем BART является относительная сложность в интерпретации результатов. Для решения этой проблемы была предложена модификация, названная ANOVA BART (англ. Additive Regression Trees based on Functional ANOVA Decomposition), которая основывается на анализе вариации функций с помощью функционального анализа вариаций (англ. Functional ANOVA). Новый подход позволяет декомпозировать вариацию функции на различные подпространства, каждое из которых отвечает за конкретный набор описательных переменных или факторов. ANOVA BART не только улучшает интерпретируемость модели, но и сохраняет и расширяет теоретические гарантии BART. Необходимость данного развития возникла из потребности в моделях, сочетающих высокую точность воспроизведения данных, высокую интерпретируемость и теоретическую надежность.
#### Метод
Метод ANOVA BART основывается на анализе вариации функции с помощью функционального анализа вариаций. Основополагающим элементом данного метода является декомпозиция функции на пространства, соответствующие различным компонентам вариации. В данном случае, пространство вариации декомпозируется на подпространства, каждое из которых отвечает за конкретный набор описательных переменных. Входные данные разбиваются на группы по группировочным переменным, после чего каждая группа представляется в виде дерева регрессии. Основным этапом метода является обучение деревов регрессии для каждой группы, чтобы отобразить вариацию функции на соответствующие подпространства. Поскольку данный подход не требует полного пересчета всех данных при изменении описательных переменных, он эффективен в высокомерных задачах. Для реализации подхода используются новые алгоритмы, которые позволяют разделить вариацию функции на компоненты с учетом ограничений на их взаимодействия. Это позволяет улучшить теоретические гарантии и повысить точность модели.
#### Результаты
Для оценки эффективности ANOVA BART проводились многочисленные эксперименты с различными данными. Были сравнивались результаты ANOVA BART и BART на тестовых наборах в задачах классификации и регрессии. Обнаружено, что ANOVA BART показывает более высокую точность и улучшенную оценку неизвестности во всех случаях. Было показано, что модель ANOVA BART предлагает более четкие оценки для каждой компоненты вариации, что д
Abstract
Bayesian Additive Regression Trees (BART) is a powerful statistical model
that leverages the strengths of Bayesian inference and regression trees. It has
received significant attention for capturing complex non-linear relationships
and interactions among predictors. However, the accuracy of BART often comes at
the cost of interpretability. To address this limitation, we propose ANOVA
Bayesian Additive Regression Trees (ANOVA-BART), a novel extension of BART
based on the functional ANOVA decomposition, which is used to decompose the
variability of a function into different interactions, each representing the
contribution of a different set of covariates or factors. Our proposed
ANOVA-BART enhances interpretability, preserves and extends the theoretical
guarantees of BART, and achieves superior predictive performance. Specifically,
we establish that the posterior concentration rate of ANOVA-BART is nearly
minimax optimal, and further provides the same convergence rates for each
interaction that are not available for BART. Moreover, comprehensive
experiments confirm that ANOVA-BART surpasses BART in both accuracy and
uncertainty quantification, while also demonstrating its effectiveness in
component selection. These results suggest that ANOVA-BART offers a compelling
alternative to BART by balancing predictive accuracy, interpretability, and
theoretical consistency.
Ссылки и действия
Дополнительные ресурсы: