In-Context Decision Making for Optimizing Complex AutoML Pipelines

2508.13657v1 cs.LG, cs.AI 2025-08-21

Авторы:

Amir Rezaei Balef, Katharina Eggensperger

Резюме на русском

## Контекст Современные машинное обучение (ML) представляют собой набор сложных пайплайнов, включающих такие этапы, как выбор алгоритмов, оптимизация гиперпараметров, оверфиттинг, предварительно обученные модели и кластеризация. Традиционные инструменты AutoML, ориентированные на упрощение процесса выбора и оптимизации моделей (Combined Algorithm Selection and Hyperparameter Optimization, CASH), стали недостаточными для решения этих задач. Требуется новое подход к оптимизации пайплайнов, который может принимать во внимание их хетерогенность и многоуровневость. Данная работа адресует эти проблемы, предлагая расширенный подход к CASH, который может эффективно адаптировать и оптимизировать современные ML-пайплайны. ## Метод Предлагаемый подход, названный PS-PFN (Posterior Sampling with Prior-Fitted Networks), является расширением стратегии Posterior Sampling (PS) в контексте max-k-armed bandit problem. PS-PFN использует PFNs (Prior-Fitted Networks) для эффективного вычисления параметров постериорного распределения максимального значения, что позволяет принимать решения в контексте полученных данных. Этот подход может применяться для разных ML-пайплайнов, принимая во внимание различные затраты на выполнение каждого этапа. Более того, PS-PFN может использовать разные PFNs для моделирования разных распределений наград на каждой итерации. Эта гибкость позволяет адаптироваться к разным типам задач и пайплайнов. ## Результаты Исследования проводились на одном новом и двух существующих бенчмарк-задачах. Сравнительные эксперименты показали, что PS-PFN превосходит другие методы AutoML и bandit-based, особенно в случае задач с большим количеством шагов и разнообразием моделей. Эксперименты с разными наборами данных и пайплайнами показали, что PS-PFN может эффективно принимать решения, адаптируясь к различным условиям задач. Результаты демонстрируют, что PS-PFN может эффективно использовать ранее полученные данные для точного оценивания и построения политик оптимизации. ## Значимость Предлагаемый подход может применяться во многих областях, где требуется оптимизация сложных ML-пайплайнов, таких как кредитный анализ, медицина и текстовой классификации. Наглядного приложения PS-PFN можно видеть в сценариях, где необходимо быстро адаптироваться к отсутствию данных или разным затратам на выполнение каждого этапа пайплайна. Этот подход позволяет увеличить эффективность и точность автоматизированных систем, сократить время разработки и снизить затраты на реализацию ML-решений. ## Выводы Результаты доказывают, что PS-PFN является эффективным методом для оптимизации сложных ML-пайплайнов. Он может хорошо справляться с разнообразием задач и пайплайнов, принимая во внимание различные затраты и характеристики ка

Abstract

Combined Algorithm Selection and Hyperparameter Optimization (CASH) has been fundamental to traditional AutoML systems. However, with the advancements of pre-trained models, modern ML workflows go beyond hyperparameter optimization and often require fine-tuning, ensembling, and other adaptation techniques. While the core challenge of identifying the best-performing model for a downstream task remains, the increasing heterogeneity of ML pipelines demands novel AutoML approaches. This work extends the CASH framework to select and adapt modern ML pipelines. We propose PS-PFN to efficiently explore and exploit adapting ML pipelines by extending Posterior Sampling (PS) to the max k-armed bandit problem setup. PS-PFN leverages prior-data fitted networks (PFNs) to efficiently estimate the posterior distribution of the maximal value via in-context learning. We show how to extend this method to consider varying costs of pulling arms and to use different PFNs to model reward distributions individually per arm. Experimental results on one novel and two existing standard benchmark tasks demonstrate the superior performance of PS-PFN compared to other bandit and AutoML strategies. We make our code and data available at https://github.com/amirbalef/CASHPlus.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

In-Context Decision Making for Optimizing Complex AutoML Pipelines

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Approximation of Box Decomposition Algorithm for Fast Hypervolume-Based Multi-Ob...

NEAT: Neighborhood-Guided, Efficient, Autoregressive Set Transformer for 3D Mole...

Sparse Attention Post-Training for Mechanistic Interpretability

Neural Coherence : Find higher performance to out-of-distribution tasks from few...

Impugan: Learning Conditional Generative Models for Robust Data Imputation

Навигация