Multi-Armed Bandits-Based Optimization of Decision Trees

2508.05957v1 cs.LG, cs.AI 2025-08-12

Авторы:

Hasibul Karim Shanto, Umme Ayman Koana, Shadikur Rahman

Резюме на русском

## Контекст Одним из ключевых вопросов в машинном обучении является оптимизация моделей деревьев решений. Их природа склонна к переобучению, так как они могут хранить ненужные фичи или шум в данных. Оптимизация моделей деревьев решений включает в себя процесс поиска оптимального баланса между объяснимостью и производительностью. Одним из ключевых этапов этой оптимизации является приведение модели к менее сложной форме, чтобы уменьшить вероятность переобучения и повысить устойчивость модели к новым данным. Несмотря на то, что существуют методы, такие как Cost-Complexity Pruning (CCP) и Reduced Error Pruning (REP), они основываются на локальных принципах, которые могут привести к неоптимальным решениям в долгосрочной перспективе. Мы предлагаем использовать Multi-Armed Bandits (MAB)-методы, чтобы решить эту проблему, так как они предлагают динамический подход к принятию решений в процессе обучения модели. ## Метод Мы предлагаем использовать разумный подход к приведению модели к оптимальному состоянию, используя MAB для принятия решений о приближении к целевой форме. MAB – это тип алгоритма, основанный на принципе exploration-exploitation, который позволяет подобрать оптимальные решения в процессе исследования. Мы используем данный подход для принятия решений о том, какие ветви дерева решений следует удалить для достижения оптимального соотношения производительности и объяснимости. Мы применяем экспериментальное исследование, чтобы оценить эффективность этого подхода в сравнении с традиционными методами. Модель MAB-based pruning будет использоваться вместе с различными деревьями решений для оптимизации модели и повышения ее общей производительности. ## Результаты Мы проводили эксперименты на нескольких датасетах, включая датасеты стандартных бенчмарков, чтобы оценить эффективность нашего подхода. Мы сравнивали эффективность нашей реализации с традиционными методами, такими как CCP и REP. Наши результаты показали, что наш подход позволяет достичь более высокой оптимальности модели дерева решений, снизившей вероятность переобучения и улучшившей прогностическую модель. Это улучшение производительности во многом обусловлено динамическим принятием решений о приближении к оптимальной модели. Мы также проводили анализ времени работы, чтобы оценить эффективность нашего подхода в сравнении с традиционными. ## Значимость Наш подход имеет потенциал для применения в отраслях, где требуется улучшение моделей на основе деревьев решений, таких как финансы, медицина и индустрия. Этот подход может повысить точность прогноза и уменьшить ошибки, связанные с переобучением. Помимо этого, мы показали, что наша реализация является более эффективной

Abstract

Decision trees, without appropriate constraints, can easily become overly complex and prone to overfit, capturing noise rather than generalizable patterns. To resolve this problem,pruning operation is a crucial part in optimizing decision trees, as it not only reduces the complexity of trees but also decreases the probability of generating overfit models. The conventional pruning techniques like Cost-Complexity Pruning (CCP) and Reduced Error Pruning (REP) are mostly based on greedy approaches that focus on immediate gains in performance while pruning nodes of the decision tree. However, this might result in a lower generalization in the long run, compromising the robust ability of the tree model when introduced to unseen data samples, particularly when trained with small and complex datasets. To address this challenge, we are proposing a Multi-Armed Bandits (MAB)-based pruning approach, a reinforcement learning (RL)-based technique, that will dynamically prune the tree to generate an optimal decision tree with better generalization. Our proposed approach assumes the pruning process as an exploration-exploitation problem, where we are utilizing the MAB algorithms to find optimal branch nodes to prune based on feedback from each pruning actions. Experimental evaluation on several benchmark datasets, demonstrated that our proposed approach results in better predictive performance compared to the traditional ones. This suggests the potential of utilizing MAB for a dynamic and probabilistic way of decision tree pruning, in turn optimizing the decision tree-based model.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Multi-Armed Bandits-Based Optimization of Decision Trees

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Prototype-Based Semantic Consistency Alignment for Domain Adaptive Retrieval

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

TimesNet-Gen: Deep Learning-based Site Specific Strong Motion Generation

Realizable Abstractions: Near-Optimal Hierarchical Reinforcement Learning

BEP: A Binary Error Propagation Algorithm for Binary Neural Networks Training

Навигация