Comparison of derivative-free and gradient-based minimization for multi-objective compositional design of shape memory alloys

2508.14127v1 cs.LG, cond-mat.mtrl-sci, math.OC 2025-08-22
Авторы:

S. Josyula, Y. Noiman, E. J. Payton, T. Giovannelli

Резюме на русском

## Контекст Шапокльниково-Хасемантовы металлы (Shape Memory Alloys, SMAs) широко применяются в различных отраслях, включая медицину, промышленность и аэрокосмическое производство, благодаря их уникальным свойствам, таким как форму changе и обратное тепловое воздействие. Однако оптимизация композиции SMAs для достижения желаемых пропертей, таких как мартенситная начальная температура (Ms), при сохранении высокой эффективности и устойчивости, представляет собой сложную задачу. Недостаток достоверных данных и высокая сложность моделей часто приводят к ограниченным результатам при использовании традиционных методов. В данном исследовании мы исследуем сравнительную эффективность дифференцируемых и недифференцируемых методов оптимизации для решения этой задачи. ## Метод Для оптимизации композиции SMAs мы применяем модели машинного обучения в качестве суррогатных предикторов, а именно дерево-основый решатель и нейронную сеть. Модели обучаются на наборе экспериментального характера по условиям металлов, а также используется физически информированная фичеризация. Для нерешательного поиска используется алгоритм COBYLA, который не требует дифференцируемости функции целевой. Для нейронной сети применяется градиентный метод TRUST-CONSTR, который работает с полученными градиентами модели. Оба метода применяются к задаче минимизации затрат при достижении целевого Ms. ## Результаты Экспериментальные результаты показали, что модель градиентного подхода (TRUST-CONSTR) показывает более стабильное поведение и способность достигать целевых точек, в то время как нерешательный подход (COBYLA) часто приводит к субоптимальным результатам, особенно при начальных гипотезах, отдаленных от целевой точки. Использование нейронной сети в качестве предиктора с градиентным подходом приводит к более надежной оптимизации, поскольку оно предоставляет дополнительные информационные сигналы для поиска оптимальных решений. ## Значимость Наш подход может быть применен для оптимизации композиции SMAs, а также других материалов, где необходимо сбалансировать противоречивые цели, такие как уменьшение затрат и достижение требуемых пропертей. Нейронные сети с градиентным подходом могут быть полезны в ситуациях, когда доступно малое количество экспериментальных данных, но требуется высокая точность моделирования. Это исследование демонстрирует ценность использования искусственного интеллекта для решения задач оптимизации в материаловедении. ## Выводы Мы демонстрируем, что градиентные методы оптимизации, использующие градиентную информацию модели, более эффективны для поиска оптимальных

Abstract

Designing shape memory alloys (SMAs) that meet performance targets while remaining affordable and sustainable is a complex challenge. In this work, we focus on optimizing SMA compositions to achieve a desired martensitic start temperature (Ms) while minimizing cost. To do this, we use machine learning models as surrogate predictors and apply numerical optimization methods to search for suitable alloy combinations. We trained two types of machine learning models, a tree-based ensemble and a neural network, using a dataset of experimentally characterized alloys and physics-informed features. The tree-based model was used with a derivative-free optimizer (COBYLA), while the neural network, which provides gradient information, was paired with a gradient-based optimizer (TRUST-CONSTR). Our results show that while both models predict Ms with similar accuracy, the optimizer paired with the neural network finds better solutions more consistently. COBYLA often converged to suboptimal results, especially when the starting guess was far from the target. The TRUST-CONSTR method showed more stable behavior and was better at reaching alloy compositions that met both objectives. This study demonstrates a practical approach to exploring new SMA compositions by combining physics-informed data, machine learning models, and optimization algorithms. Although the scale of our dataset is smaller than simulation-based efforts, the use of experimental data improves the reliability of the predictions. The approach can be extended to other materials where design trade-offs must be made with limited data.

Ссылки и действия