Benchmarking Self-Driving Labs

2508.06642v1 physics.comp-ph, cond-mat.mtrl-sci, cs.LG, physics.data-an 2025-08-13
Авторы:

Adedire D. Adesiji, Jiashuo Wang, Cheng-Shu Kuo, Keith A. Brown

Резюме на русском

## Контекст Современные материаловедческие исследования стремятся к ускорению процесса открытия новых материалов. Одним из вариантов решения этой задачи являются self-driving labs (SDL) — системы, которые применяют машинное обучение для выбора экспериментов и автоматизации их проведения. Такие системы позволяют осуществлять эксперименты быстрее, надежнее, интеллектуальнее и с более полной метаданной, чем при использовании традиционных методов. Однако, существуют недостатки в понимании того, насколько эффективны SDL в ускорении понимания материалов. Эта статья предлагает обзор современного понимания эффективности SDL, основываясь на показателях, таких как Acceleration Factor (AF) и Enhancement Factor (EF), которые помогают оценить, на сколько SDL ускоряют процесс открытия материалов в сравнении с другими стратегиями. ## Метод SDL основываются на комбинации машинного обучения и автоматизированных технологий. Методы оценки эффективности SDL основываются на двух основных метриках: Acceleration Factor (AF) и Enhancement Factor (EF). AF определяет, на сколько быстрее SDL выполняют эксперименты в сравнении с другими методами, а EF показывает, на сколько эффективнее система получает желаемые результаты. Эти метрики позволяют графически отобразить отношение SDL к традиционным методам. Моделирование экспериментов, выполняемых SDL, позволяет понять, как эти метрики зависят от сложности и статистических свойств пространства параметров. ## Результаты Из статистических данных опубликованных работ выясняется, что средний AF около 6, что указывает на значительное ускорение. Однако, значения AF могут отличаться в зависимости от сложности пространства параметров. Методы оценки EF показывают, что он варьируется в пределах широкого диапазона, но среднее значение составляет 10-20 экспериментов на одну измерительную размерность. Этот результат подтверждает, что SDL эффективны в широком диапазоне ситуаций, особенно когда пространство параметров имеет высокую размерность. ## Значимость SDL могут применяться в различных областях, где требуется ускорение и улучшение процессов открытия материалов. Основные преимущества SDL заключаются в быстродействии, надежности и точности в выполнении экспериментов, а также в получении богатых метаданных. Эти преимущества могут привести к быстрому прогрессу в материаловедческих исследованиях и к перелому в технологиях, где высокая скорость откровений и их качество играют ключевую роль. ## Выводы SDL демонстрируют сильное потенциальное влияние на ускорение открытия материалов. Однако, их эффективность зависит от свойств пространства параметров и

Abstract

A key goal of modern materials science is accelerating the pace of materials discovery. Self-driving labs, or systems that select experiments using machine learning and then execute them using automation, are designed to fulfil this promise by performing experiments faster, more intelligently, more reliably, and with richer metadata than conventional means. This review summarizes progress in understanding the degree to which SDLs accelerate learning by quantifying how much they reduce the number of experiments required for a given goal. The review begins by summarizing the theory underlying two key metrics, namely acceleration factor AF and enhancement factor EF, which quantify how much faster and better an algorithm is relative to a reference strategy. Next, we provide a comprehensive review of the literature, which reveals a wide range of AFs with a median of 6, and that tends to increase with the dimensionality of the space, reflecting an interesting blessing of dimensionality. In contrast, reported EF values vary by over two orders of magnitude, although they consistently peak at 10-20 experiments per dimension. To understand these results, we perform a series of simulated Bayesian optimization campaigns that reveal how EF depends upon the statistical properties of the parameter space while AF depends on its complexity. Collectively, these results reinforce the motivation for using SDLs by revealing their value across a wide range of material parameter spaces and provide a common language for quantifying and understanding this acceleration.

Ссылки и действия