MOCA-HESP: Meta High-dimensional Bayesian Optimization for Combinatorial and Mixed Spaces via Hyper-ellipsoid Partitioning

2508.06847v1 stat.ML, cs.LG 2025-08-13
Авторы:

Lam Ngo, Huong Ha, Jeffrey Chan, Hongyu Zhang

Резюме на русском

## Контекст В последние годы внимание сообщества расширилось на область градиентно-свободной оптимизации в высокомерных пространствах, так как она находит применение в различных сферах, таких как машинное обучение, экономика и технологии. Однако, существующие методы BO значительно ограничены, так как они привязаны к оптимизации в пространствах последовательностей или в пространствах, состоящих из числовых переменных. Недостаток методов BO в области бинарных, категориальных и смешанных переменных является главной проблемой, которая еще не удалось решить. Многие предыдущие исследования сталкиваются с проблемами, такими как ограниченная скорость оптимизации, неэффективность в высокомерных пространствах и трудности в обработке смешанных типов данных. Эти проблемы требуют разработки новых методов, которые могли бы эффективно работать в пространствах с высокой размерностью и комбинаторными переменными. ## Метод Метод MOCA-HESP (Meta-Algorithm for Combinatorial and Mixed Spaces via Hyper-Ellipsoid Partitioning) представляет собой новый подход к высокомерной оптимизации, который использует гипер-эллипсоидные функции для деления пространства. Он использует различные техники кодирования категориальных переменных для работы с высокомерными пространствами, включая категориальные, бинарные и смешанные переменные. Особенностью этого подхода является использование метода выбора лучшего оптимизатора с использованием мульти-арми Bandit, который позволяет точно выбирать оптимальные параметры для работы в каждом конкретном случае. Таким образом, этот метод может адаптироваться к различным типам пространств и их структурам. Также, MOCA-HESP является мета-алгоритмом, который может быть интегрирован с другими методами BO для улучшения их производительности в комбинаторных и смешанных пространствах. ## Результаты Для оценки производительности MOCA-HESP на тестовой выборке были проведены эксперименты на как синтетических, так и на реальных данных. Для синтетических данных были использованы различные модели, включая модель с несколькими входами и выходами, а для реальных данных — данные из различных приложений, таких как задачи поиска и задачи логистики. Наши результаты показали, что MOCA-HESP существенно превосходит существующие методы BO в скорости оптимизации, точности и эффективности в работе с смешанными пространствами. Также были проведены сравнительные тесты с такими методами, как Standard BO, CASMOPOLITAN и Bounce, которые подтвердили высокую эффективность MOCA-HESP в работе с высокомерными пространствами. ## Значимость Этот метод может быть применен в различных областях, таких как машинное обучение, анализ данных, проектирование систем, виртуализация и другие сферы

Abstract

High-dimensional Bayesian Optimization (BO) has attracted significant attention in recent research. However, existing methods have mainly focused on optimizing in continuous domains, while combinatorial (ordinal and categorical) and mixed domains still remain challenging. In this paper, we first propose MOCA-HESP, a novel high-dimensional BO method for combinatorial and mixed variables. The key idea is to leverage the hyper-ellipsoid space partitioning (HESP) technique with different categorical encoders to work with high-dimensional, combinatorial and mixed spaces, while adaptively selecting the optimal encoders for HESP using a multi-armed bandit technique. Our method, MOCA-HESP, is designed as a \textit{meta-algorithm} such that it can incorporate other combinatorial and mixed BO optimizers to further enhance the optimizers' performance. Finally, we develop three practical BO methods by integrating MOCA-HESP with state-of-the-art BO optimizers for combinatorial and mixed variables: standard BO, CASMOPOLITAN, and Bounce. Our experimental results on various synthetic and real-world benchmarks show that our methods outperform existing baselines. Our code implementation can be found at https://github.com/LamNgo1/moca-hesp

Ссылки и действия