Comparison of derivative-free and gradient-based minimization for multi-objective compositional design of shape memory alloys
2508.14127v1
cs.LG, cond-mat.mtrl-sci, math.OC
2025-08-22
Авторы:
S. Josyula, Y. Noiman, E. J. Payton, T. Giovannelli
Резюме на русском
## Контекст
Шапокльниково-Хасемантовы металлы (Shape Memory Alloys, SMAs) широко применяются в различных отраслях, включая медицину, промышленность и аэрокосмическое производство, благодаря их уникальным свойствам, таким как форму changе и обратное тепловое воздействие. Однако оптимизация композиции SMAs для достижения желаемых пропертей, таких как мартенситная начальная температура (Ms), при сохранении высокой эффективности и устойчивости, представляет собой сложную задачу. Недостаток достоверных данных и высокая сложность моделей часто приводят к ограниченным результатам при использовании традиционных методов. В данном исследовании мы исследуем сравнительную эффективность дифференцируемых и недифференцируемых методов оптимизации для решения этой задачи.
## Метод
Для оптимизации композиции SMAs мы применяем модели машинного обучения в качестве суррогатных предикторов, а именно дерево-основый решатель и нейронную сеть. Модели обучаются на наборе экспериментального характера по условиям металлов, а также используется физически информированная фичеризация. Для нерешательного поиска используется алгоритм COBYLA, который не требует дифференцируемости функции целевой. Для нейронной сети применяется градиентный метод TRUST-CONSTR, который работает с полученными градиентами модели. Оба метода применяются к задаче минимизации затрат при достижении целевого Ms.
## Результаты
Экспериментальные результаты показали, что модель градиентного подхода (TRUST-CONSTR) показывает более стабильное поведение и способность достигать целевых точек, в то время как нерешательный подход (COBYLA) часто приводит к субоптимальным результатам, особенно при начальных гипотезах, отдаленных от целевой точки. Использование нейронной сети в качестве предиктора с градиентным подходом приводит к более надежной оптимизации, поскольку оно предоставляет дополнительные информационные сигналы для поиска оптимальных решений.
## Значимость
Наш подход может быть применен для оптимизации композиции SMAs, а также других материалов, где необходимо сбалансировать противоречивые цели, такие как уменьшение затрат и достижение требуемых пропертей. Нейронные сети с градиентным подходом могут быть полезны в ситуациях, когда доступно малое количество экспериментальных данных, но требуется высокая точность моделирования. Это исследование демонстрирует ценность использования искусственного интеллекта для решения задач оптимизации в материаловедении.
## Выводы
Мы демонстрируем, что градиентные методы оптимизации, использующие градиентную информацию модели, более эффективны для поиска оптимальных
Abstract
Designing shape memory alloys (SMAs) that meet performance targets while
remaining affordable and sustainable is a complex challenge. In this work, we
focus on optimizing SMA compositions to achieve a desired martensitic start
temperature (Ms) while minimizing cost. To do this, we use machine learning
models as surrogate predictors and apply numerical optimization methods to
search for suitable alloy combinations. We trained two types of machine
learning models, a tree-based ensemble and a neural network, using a dataset of
experimentally characterized alloys and physics-informed features. The
tree-based model was used with a derivative-free optimizer (COBYLA), while the
neural network, which provides gradient information, was paired with a
gradient-based optimizer (TRUST-CONSTR). Our results show that while both
models predict Ms with similar accuracy, the optimizer paired with the neural
network finds better solutions more consistently. COBYLA often converged to
suboptimal results, especially when the starting guess was far from the target.
The TRUST-CONSTR method showed more stable behavior and was better at reaching
alloy compositions that met both objectives. This study demonstrates a
practical approach to exploring new SMA compositions by combining
physics-informed data, machine learning models, and optimization algorithms.
Although the scale of our dataset is smaller than simulation-based efforts, the
use of experimental data improves the reliability of the predictions. The
approach can be extended to other materials where design trade-offs must be
made with limited data.