📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня

📄 Temperature-Aware Recurrent Neural Operator for Temperature-Dependent Anisotropic Plasticity in HCP Materials

2025-08-28

Авторы:

Yannick Hollenweger, Dennis M. Kochman, Burigede Liu

## Контекст Пластичность анизотропных материалов остается сложной проблемой в компьютерных вычислениях механики. Особенно затруднена моделирование таких материалов, как гипербоидные графеновые слои (HCP), из-за сильной термопластической анизотропии и взаимодействия с температурой. Существующие модели, основанные на гранулярных нейронных сетях, сталкиваются с проблемами длительного обучения, неоднородностью решений по времени и ограниченной общностью. Необходимость эффективных, точных и универсальных моделей побудила разработку Temperature-Aware Recurrent Neural Operator (TRNO) — модели с новой архитектурой, которая объединяет высокую точность, гибкость и универсальность. ## Метод TRNO основывается на архитектуре нейронных операторов, которая обеспечивает временную независимость и общность. Модель использует атангонные операторы для представления пространственных зависимостей и рекуррентные слои для захвата путей зависимостей. Особенностью TRNO является включение термодинамических параметров, которые позволяют модель работать с температурными эффектами. Архитектура построена таким образом, чтобы обеспечивать высокую точность в прогнозировании анизотропной пластичности в расплавленных материалах. Модель обучается с использованием пакета pyTorch, используя многослойные входные данные, что позволяет достичь лучшей общности и эффективности. ## Результаты Для оценки TRNO, авторы проводили эксперименты с поликристаллическим магнием, известным своим сильным пластическим анизотропием. Модель обучалась на имитационных данных, полученных с помощью метода симуляции эволюции структуры. Результаты показали, что TRNO обеспечивает высокую точность в предсказании характеристик пластичности в различных температурах и разрешениях времени. Она превосходит GRU и LSTM по времену обучения и точности прогноза. Более того, TRNO достигла скорости работы свыше 1000 раз выше стандартных моделей в многомерных симуляциях. ## Значимость TRNO может быть применена в различных областях, включая микромасштабные моделирования материалов, оптимизацию конструкций и прогнозирование прочности. Ее высокая точность и эффективность делают ее привлекательной для решения задач, требующих быстрого и точного определения характеристик пластичности. Этот подход обещает значительное ускорение процессов разработки материалов и моделирования, подрывая традиционные способы моделирования. ## Выводы Результаты демонстрируют, что TRNO является эффективной альтернативой традиционным моделям в области пластичности. Будущие исследования будут сконцентрированы на расширении модели

Annotation:

Neural network surrogate models for constitutive laws in computational mechanics have been in use for some time. In plasticity, these models often rely on gated recurrent units (GRUs) or long short-term memory (LSTM) cells, which excel at capturing path-dependent phenomena. However, they suffer from long training times and time-resolution-dependent predictions that extrapolate poorly. Moreover, most existing surrogates for macro- or mesoscopic plasticity handle only relatively simple material be...

ID: 2508.18806v1 cond-mat.mtrl-sci, cs.LG

arXiv PDF

📄 A simulation-based training framework for machine-learning applications in ARPES

2025-08-26

Авторы:

MengXing Na, Chris Zhou, Sydney K. Y. Dufresne, Matteo Michiardi, Andrea Damascelli

## Контекст Angle-resolved photoemission spectroscopy (ARPES) является важной технологией для изучения поверхностных и энергетических структур в материалах. Она позволяет проанализировать энергетическое распределение электронов на поверхности и динамику их интеракции с зоной Ферми. Несмотря на развитие технологий, ARPES сталкивается с проблемами в обработке и анализе многомерных данных, возникающих при использовании современных сенсоров и систем измерения. Машинное обучение (ML) используется для упрощения этих задач, однако недостаток высококачественных данных для обучения ограничивает его эффективность. Целью настоящей работы является разработка симуляционного фреймворка для генерации данных ARPES, который может значительно упростить исследовательский процесс. ## Метод Разработанный фреймворк, названный Aurelia, является открытым исходным кодом и специализируется на симуляции сигналов ARPES. Он использует геометрические модели, физические модели переходов электронов и методы симуляции отклика материала на ангулярно-резолюционное действие фотоэмиссии. Фреймворк генерирует синтетические данные ARPES, которые могут быть использованы для обучения моделей ML, включая глубокие нейронные сети. Для демонстрации возможностей Aurelia, мы обучили конволюционную нейронную сеть (CNN) для оценки качества спектров ARPES, важной задачей в эксперименте. ## Результаты Используя Aurelia, мы генерировали большие наборы синтетических данных ARPES, которые были использованы для обучения CNN. Модель была специально настроена для оценки качества спектров ARPES в начальной стадии эксперимента, которая требует точной настройки и анализа. Наши результаты показали, что CNN, обученная на синтетических данных, превосходит людской анализ в точности определения качества спектров и быстрости выявления оптимальных областей измерений. Это доказывает, что симуляционные данные ARPES могут эффективно заменить экспериментальные данные в ходе обучения ML-моделей. ## Значимость Разработанный подход имеет широкое применение в области ARPES, в том числе для автоматизации анализа данных, улучшения точности измерений и сокращения времени экспериментов. Он также может быть использован в других областях, где требуется синтез высококачественных данных для обучения ML-моделей. Преимуществами работы является уменьшение затрат на сбор экспериментальных данных, увеличение точности исследований и возможность исследователям сосредоточиться на анализе результатов вместо рутинных задач. ## Выводы Работа доказывает, что симуляционные данные ARPES могут значительно улучшить эффективность и точность исследований в области глубокого обучения. Будущие исс

Annotation:

In recent years, angle-resolved photoemission spectroscopy (ARPES) has advanced significantly in its ability to probe more observables and simultaneously generate multi-dimensional datasets. These advances present new challenges in data acquisition, processing, and analysis. Machine learning (ML) models can drastically reduce the workload of experimentalists; however, the lack of training data for ML -- and in particular deep learning -- is a significant obstacle. In this work, we introduce an o...

ID: 2508.15983v1 cond-mat.mtrl-sci, cs.LG, physics.comp-ph

arXiv PDF

📄 FIRE-GNN: Force-informed, Relaxed Equivariance Graph Neural Network for Rapid and Accurate Prediction of Surface Properties

2025-08-26

Авторы:

Circe Hsu, Claire Schlesinger, Karan Mudaliar, Jordan Leung, Robin Walters, Peter Schindler

#### Контекст Определение рабочей функции и энергии трещины поверхности является ключевым заданием при разработке материалов для электронных приборов, систем наноэлектроники и новых типов катализаторов. Эти свойства требуют точных прогнозов для эффективного использования материалов в новых технологиях. Однако первые принципы (DFT), хотя и точны, являются сильно ресурсоемкими, что делает широкомасштабное скрининговое моделирование проблематичным. Альтернативными подходами становятся машинное обучение и аппроксимация интераторных потенциалов (MLIP), которые могут ускорить процесс обучения, но часто требуют уточненной архитектуры для предсказания сложных условий. В этой работе авторы предлагают FIRE-GNN (Force-Informed, Relaxed Equivariance Graph Neural Network), который стало новым стандартом для предсказания рабочей функции и энергии трещины поверхности. #### Метод FIRE-GNN является архитектурой нового поколения, которая объединяет несколько технических достижений. Во-первых, она использует графовые нейронные сети для представления поверхности в виде графа, где узлы — атомы, и ребра — связи между ними. Во-вторых, архитектура содержит уровень моделирования симметрии, который учитывает нормальные симметрии поверхности. Третьим элементом — интеграция MLIP-сигналов, позволяющая вычислительно эффективно предсказывать силы межатомных взаимодействий. Эта кардинальная интеграция позволяет технологически исключить многие ресурсозатратные вычисления, в то же время сохраняя высокую точность. #### Результаты Используя несколько данных, авторы проводили эксперименты с широким качеством поверхностных структур. FIRE-GNN показал существенное улучшение метрик сравнения, достигнув ошибки по абсолютной величине в рабочей функции, сократив её до 0.065 еВ. Это значительно превышает показатели предыдущих моделей. Была также проведена оценка общей генерализуемости, демонстрируя высокую производительность FIRE-GNN на выборках, отличных от обучающих. Такой результат указывает на высокую универсальность и пригодность модели для работы с широким спектром входных данных. #### Значимость Такое предложение модели может быть использовано в сферах, где решается проблема оптимизации поверхностных свойств материалов: от электронной техники до новых материалов для силовых элементов. Разработка FIRE-GNN также оказывает значительное преимущество в скорости работы и экономичности вычислений. Это включает в себя не только ускорение скринингового процесса, но и возможность обработки больших массивов данных в реальном времени

Annotation:

The work function and cleavage energy of a surface are critical properties that determine the viability of materials in electronic emission applications, semiconductor devices, and heterogeneous catalysis. While first principles calculations are accurate in predicting these properties, their computational expense combined with the vast search space of surfaces make a comprehensive screening approach with density functional theory (DFT) infeasible. Here, we introduce FIRE-GNN (Force-Informed, Rel...

ID: 2508.16012v1 cond-mat.mtrl-sci, cs.LG, physics.comp-ph

arXiv PDF

📄 Machine Learning Time Propagators for Time-Dependent Density Functional Theory Simulations

2025-08-26

Авторы:

Karan Shah, Attila Cangi

#### Контекст Задача исследования — ускорение симуляций электронных динамик в рамках временной зависимой теории диффузии фермионов (TDDFT). Эта методология широко применяется для исследований подлинных электронных процессов при воздействии внешних временно зависимых воздействий, таких как лазерные поля. Однако существующие традиционные численные методы для решения уравнений TDDFT часто требуют ресурсоемких вычислений, что ограничивает их применение в реальном времени. Задача нашего исследования — развить альтернативный подход, основанный на нейронных сетях, для более эффективной реализации временных преобразований в TDDFT. #### Метод Мы предлагаем использовать **авторегрессивные нейронные операторы** в качестве временных преобразователей для электронной плотности в рамках временной зависимой TDDFT. Наша модель основывается на обучении с подкреплением использования физико-ориентированных ограничений и высококачественных тренировочных данных. Архитектура нейросети включает в себя конвейер, который преобразует временные шаги электронных динамик, обеспечивая высокую точность и гибкость. Мы используем ряд тренировочных моделей на основе реальных данных для эффективного обучения, что позволяет модели решать задачи с детализацией высокого качества. #### Результаты Мы проводили эксперименты на классе одномерных диатомических молекул, взаимодействующих с различными лазерными параметрами. Наши результаты показали, что модель преобразователя была в среднем 10 раз быстрее существующих численных методов, при этом сохраняя высокую точность. Мы также провели анализ точности и стабильности, что подтвердило высокую надежность и эффективность предложенного подхода. Модель удалось обеспечить быструю реакцию на изменения в внешних условиях, что делает ее подходящей для реального времени. #### Значимость Предложенная модель может быть применена в многих областях, например в моделировании лазерных воздействий на материалы в реальном времени, а также в исследованиях химических реакций и взаимодействий. Ее преимущества заключаются в ускорении вычислений, повышении точности и повышении эффективности в сравнении с традиционными методами. Это открывает новые возможности для динамического моделирования сложных систем под воздействием лазерных полей. #### Выводы Мы представили новый подход к ускорению симуляций TDDFT с использованием нейронных операторов. Наши результаты показали высокую эффективность и точность модели, что делает ее привлекательной для реального времени. Будущие исследования будут сконцентрированы на расширении модели для более сложных систем высшего размерности и включ

Annotation:

Time-dependent density functional theory (TDDFT) is a widely used method to investigate electron dynamics under external time-dependent perturbations such as laser fields. In this work, we present a novel approach to accelerate electron dynamics simulations based on real time TDDFT using autoregressive neural operators as time-propagators for the electron density. By leveraging physics-informed constraints and featurization, and high-resolution training data, our model achieves superior accuracy...

ID: 2508.16554v1 cond-mat.mtrl-sci, cs.LG, physics.comp-ph

arXiv PDF

📄 End-to-End Analysis of Charge Stability Diagrams with Transformers

2025-08-23

Авторы:

Rahul Marchand, Lucas Schorling, Cornelius Carlsson, Jonas Schuff, Barnaby van Straaten, Taylor L. Patti, Federico Fedele, Joshua Ziegler, Parth Girdhar, Pranav Vaidhyanathan, Natalia Ares

#### Контекст Управление и анализ динамики заряда (charge stability diagrams, CSV) в системах квантовых точек (quantum dots, QD) является ключевым заданием в развитии спин-базированных квантовых компьютеров. Необходимость эффективного виртуального управления точками заряда (virtual gate calibration), инициализации заряда и коррекции дрейфа требует развития методик, обеспечивающих высокую точность и универсальность. Традиционные методы, основанные на конволюционных нейросетях (convolutional neural networks, CNN), часто требуют долгих итерационных обучений и не всегда подходят для новых архитектур устройств. Целью данного исследования является развитие универсального, архитектурно-агностичного подхода к анализу CSV, позволяющего значительно сократить трудоемкость и улучшить обобщаемость. #### Метод Для решения поставленных задач предлагается использовать трансформерные модели (transformers) с фреймвормом end-to-end learning. Ключевой идеей является использование моделей, обученных на широких наборах данных, для точного идентификации трехзвенных точек (triple points) и их связей на диаграммах заряда. Архитектура модели включает в себя препроцессинг данных, преобразование их в видеоматериалы, а также использование трансформеров для определения геометрических отношений между точками. Метод не требует предварительной подготовки конкретных архитектур устройств и позволяет обеспечить высокую универсальность и эффективность. #### Результаты Исследование проводилось на трех разных архитектурах спин-кубитов, используя наборы данных, полученные с различными условиями экспериментов. Модель показала значительное превосходство по точности и скорости работы перед CNN-подходами. Обнаружение трехзвенных точек производилось с долей точности ~95%, а время работы модели сократилось в 5 раз. Благодаря использованию обучения на больших данных, модель продемонстрировала высокую универсальность и не требовала дополнительных подготовительных этапов для работы на новых данных. #### Значимость Разработанный подход может быть применен в различных областях, включая квантовый контроль, конфигурацию устройств квантовых точек и имитацию квантовых систем. Он обеспечивает значительное сокращение времени обучения и увеличивает скорость работы, что является ключевым фактором для масштабируемых систем квантового вычисления. Этот подход также может быть использован для исследования новых архитектур квантовых устройств и для улучшения процесса автоматизации в спин-квантовой технологии. #### Выводы Разработанный метод определяется как сильный повод для дальнейшего исследования в области квантовых сист

Annotation:

Transformer models and end-to-end learning frameworks are rapidly revolutionizing the field of artificial intelligence. In this work, we apply object detection transformers to analyze charge stability diagrams in semiconductor quantum dot arrays, a key task for achieving scalability with spin-based quantum computing. Specifically, our model identifies triple points and their connectivity, which is crucial for virtual gate calibration, charge state initialization, drift correction, and pulse sequ...

ID: 2508.15710v1 cond-mat.mes-hall, cond-mat.mtrl-sci, cs.LG, quant-ph

arXiv PDF

📄 Symmetry-Constrained Multi-Scale Physics-Informed Neural Networks for Graphene Electronic Band Structure Prediction

2025-08-16

Авторы:

Wei Shan Lee, I Hang Kwok, Kam Ian Leong, Chi Kiu Althina Chau, Kei Chon Sio

## Контекст Определение электронных банд структур двумерных материалов является ключевым вопросом в теории кристаллов и электронной структуре материалов. Двумерные материалы, такие как графен, обладают уникальными свойствами, которые определяются этими бандами. Традиционные методы, такие как Дрейфус-Крыстофф-ширфт (DKS) или теоретические модели, либо неэффективны, либо требуют значительных дополнительных ресурсов. Таким образом, есть необходимость в развитии методов, которые бы быстро и точно предсказывали электронные банды, сохраняя геометрические и физические свойства материалов. ## Метод Метод предлагаемый в статье основывается на применении физико-основанного обучения с учетом симметрий. Основой является многошаговый подход, включающий в себя ResNet-6 сети, которые работают со специальными фичизированными формами. Три специальных голов (K-head, M-head, General head) отвечают за различные характеристики банд структур, включая глобальные тенденции и локальные физические явления. Метод также включает в себя систематическую схему градиентного снижения, что позволяет наладить иерархический обученный подход, начиная с глобальной топологии и заканчивая локальными физическими свойствами. Важной частью метода является включение 12 операций группы симметрии, которые гарантируют точное сохранение симметрии в результатах. ## Результаты Эксперименты проводились на базе 10 000 к-точек, обучение продолжилось 300 эпох с последовательным увеличением веса градиентного снижения. Результаты показывают, что модель достигла 99.99% снижения тренировочной потери, при этом потеря на валидации составила 0.0085. Точность предсказания модели внутри границы 30.3 микроэлектронных вольт для дирак-точек, при этом средние ошибки для валентных и кондуктивных банд составили 53.9 мегаэлектронных вольт и 40.5 мегаэлектронных вольт соответственно. Эти результаты указывают на высокую точность модели в предсказании электронных банд в графене. ## Значимость Метод предлагаемый в статье имеет широкие области применения в области кристаллографии, теории кристаллов и физики квантовых материалов. Его основное преимущество заключается в том, что он сочетает в себе высокую точность и эффективность вычислений. Это может привести к ускорению дискавери процесса в графене и других двумерных материалах. Будущие исследования могут направлены на расширение данного подхода на другие типы двумерных материалов, чтобы обобщить его применение. ##

Annotation:

Accurate prediction of electronic band structures in two-dimensional materials remains a fundamental challenge, with existing methods struggling to balance computational efficiency and physical accuracy. We present the Symmetry-Constrained Multi-Scale Physics-Informed Neural Network (SCMS-PINN) v35, which directly learns graphene band structures while rigorously enforcing crystallographic symmetries through a multi-head architecture. Our approach introduces three specialized ResNet-6 pathways --...

ID: 2508.10718v1 cond-mat.mtrl-sci, cs.LG, physics.comp-ph

arXiv PDF

📄 Benchmarking Self-Driving Labs

2025-08-13

Авторы:

Adedire D. Adesiji, Jiashuo Wang, Cheng-Shu Kuo, Keith A. Brown

## Контекст Современные материаловедческие исследования стремятся к ускорению процесса открытия новых материалов. Одним из вариантов решения этой задачи являются self-driving labs (SDL) — системы, которые применяют машинное обучение для выбора экспериментов и автоматизации их проведения. Такие системы позволяют осуществлять эксперименты быстрее, надежнее, интеллектуальнее и с более полной метаданной, чем при использовании традиционных методов. Однако, существуют недостатки в понимании того, насколько эффективны SDL в ускорении понимания материалов. Эта статья предлагает обзор современного понимания эффективности SDL, основываясь на показателях, таких как Acceleration Factor (AF) и Enhancement Factor (EF), которые помогают оценить, на сколько SDL ускоряют процесс открытия материалов в сравнении с другими стратегиями. ## Метод SDL основываются на комбинации машинного обучения и автоматизированных технологий. Методы оценки эффективности SDL основываются на двух основных метриках: Acceleration Factor (AF) и Enhancement Factor (EF). AF определяет, на сколько быстрее SDL выполняют эксперименты в сравнении с другими методами, а EF показывает, на сколько эффективнее система получает желаемые результаты. Эти метрики позволяют графически отобразить отношение SDL к традиционным методам. Моделирование экспериментов, выполняемых SDL, позволяет понять, как эти метрики зависят от сложности и статистических свойств пространства параметров. ## Результаты Из статистических данных опубликованных работ выясняется, что средний AF около 6, что указывает на значительное ускорение. Однако, значения AF могут отличаться в зависимости от сложности пространства параметров. Методы оценки EF показывают, что он варьируется в пределах широкого диапазона, но среднее значение составляет 10-20 экспериментов на одну измерительную размерность. Этот результат подтверждает, что SDL эффективны в широком диапазоне ситуаций, особенно когда пространство параметров имеет высокую размерность. ## Значимость SDL могут применяться в различных областях, где требуется ускорение и улучшение процессов открытия материалов. Основные преимущества SDL заключаются в быстродействии, надежности и точности в выполнении экспериментов, а также в получении богатых метаданных. Эти преимущества могут привести к быстрому прогрессу в материаловедческих исследованиях и к перелому в технологиях, где высокая скорость откровений и их качество играют ключевую роль. ## Выводы SDL демонстрируют сильное потенциальное влияние на ускорение открытия материалов. Однако, их эффективность зависит от свойств пространства параметров и

Annotation:

A key goal of modern materials science is accelerating the pace of materials discovery. Self-driving labs, or systems that select experiments using machine learning and then execute them using automation, are designed to fulfil this promise by performing experiments faster, more intelligently, more reliably, and with richer metadata than conventional means. This review summarizes progress in understanding the degree to which SDLs accelerate learning by quantifying how much they reduce the number...

ID: 2508.06642v1 physics.comp-ph, cond-mat.mtrl-sci, cs.LG, physics.data-an

arXiv PDF

📄 Role of Large Language Models and Retrieval-Augmented Generation for Accelerating Crystalline Material Discovery: A Systematic Review

2025-08-13

Авторы:

Agada Joseph Oche, Arpan Biswas

## Контекст Кристаллические материалы широко используются в различных областях, включая электронику, оптику, биомедицину и энергоснабжение. Однако нахождение новых кристаллических материалов для этих приложений требует значительных затрат на время и ресурсы. Традиционные методы исследований, такие как симуляции и эксперименты, требуют многократного повторения тестов, что увеличивает затраты. Большая часть работы выполняется вручную, что ограничивает скорость и эффективность открытия новых материалов. В этой ситуации искусственные нейронные сети, особенно широкомасштабные модели языкового моделирования (LLMs), формируются как мощные инструменты для ускорения процесса открытия материалов. Они могут обрабатывать огромные объемы данных, включая литературу и базы данных, для точечного поиска возможных кандидатов на материалы и выявления новых структур. Наряду с ними, технологии генерируемого восстановления (Retrieval-Augmented Generation, RAG) объединяют МЛМ с доменной информацией, позволяя выполнять более точные и контекстуальные поиски. Целью данного исследования является изучение использования LLMs и RAG в области кристаллической материаловедения, а также определение их потенциала для ускорения процесса открытия материалов. ## Метод Для изучения возможностей LLMs и RAG в кристаллической материаловедении выбрана систематическая методология. Было проведено поисковое исследование по всему миру в базах данных и литературе с использованием ключевых слов, таких как "Large Language Models", "Retrieval-Augmented Generation", "Crystalline Material Discovery", "Materials Science", "Artificial Intelligence in Material Science". Было проанализировано множество работ, включая теоретические работы, экспериментальные исследования и системы, которые использовали МЛМ и RAG для решения проблем кристаллического материаловедения. Был изучен поток работы, включая сбор данных, обучение моделей, интеграцию доменной информации, а также оценку результатов. Была рассмотрена широкая палитра задач, включая кристаллическую структуру, дефекты, открытие материалов, майнинг литературных источников и интеграцию баз данных. Еще одним ключом к изучению было исследование возможностей и ограничений технологий LLM и RAG, а также их сочетания с источниками внешнего знания для повышения эффективности. ## Результаты Исследование выявило несколько направлений, в которых LLMs и RAG достигли удачного результата. Например, в области кристаллической структуры, LLMs показали способность предсказать и анализировать структуры кристаллов, а также выявлять потенциальные дефекты. В области дефектов, LLMs могут определять и прогноз

Annotation:

Large language models (LLMs) have emerged as powerful tools for knowledge-intensive tasks across domains. In materials science, to find novel materials for various energy efficient devices for various real-world applications, requires several time and cost expensive simulations and experiments. In order to tune down the uncharted material search space, minimizing the experimental cost, LLMs can play a bigger role to first provide an accelerated search of promising known material candidates. Furt...

ID: 2508.06691v1 cond-mat.mtrl-sci, cs.LG

arXiv PDF

📄 Explainable AI for Curie Temperature Prediction in Magnetic Materials

2025-08-13

Авторы:

M. Adeel Ajaib, Fariha Nasir, Abdul Rehman

#### Контекст Предсказание Кюри (Curie) температуры в магнитных материалах является важной задачей в сфере материалов и физики. Температура Кюри определяет точку, при которой материал перестает быть магнитным. Изучение этого показателя необходимо для разработки материалов с управляемыми магнитными свойствами. Несмотря на развитие машинного обучения в материаловедении, оценка Curie-температуры остается недостаточно точной и понятной. Большинство существующих моделей не предоставляют понятных выводов о том, какие физико-химические характеристики влияют на Curie-температуру. Этот недостаток снижает доверие к моделям и ограничивает их применение в научных и промышленных областях. #### Метод Мы применяем машинное обучение для предсказания Curie-температур с использованием базы данных NEMAD. В качестве входных данных используются химические и физические описательные признаки материалов. Для повышения точности и понятности результатов мы модифицировали данные, добавив дополнительные компоненты, такие как свойства атомов и магнитные моменты. Мы использовали модели Extra Trees Regressor, Random Forest и Gradient Boosting. Для понимания влияния отдельных признаков на результат использовались методы SHAP. Кроме того, мы применили кластеризацию k-means для анализа химически различных групп материалов. #### Результаты Модель Extra Trees Regressor показала самый высокий R2-результат, достигая значения 0,85 ± 0,01 при кросс-валидации. Это улучшение связано с использованием дополнительных признаков и оптимизированным предварительным процессом обработки данных. Анализ SHAP позволил выявить ключевые факторы, влияющие на Curie-температуру, в том числе средний атомный номер и магнитный момент. Использование кластеризации позволило выделить химически различные группы материалов, что дало более глубокое понимание взаимосвязи между химическими свойствами и Curie-температурой. #### Значимость Результаты приложения Explainable AI могут быть использованы в промышленности и науке для оптимизации материалов с управляемыми магнитными свойствами. Использование понятных моделей обучения позволяет улучшить надежность и доверие к результатам. Этот подход может быть распространен на другие задачи, где необходимо объяснение результатов моделирования. Это дает возможность расширить применение машинного обучения в области материалов, где важно понимать причины модельных выводов. #### Выводы Мы успешно применили машинное обучение для точного предсказания Curie-температур с помощью дополнительных признаков и объяснительных методов. Наши результаты показывают, что Extra Trees Regressor является наиболее эффективным для этой задачи. Дальней

Annotation:

We explore machine learning techniques for predicting Curie temperatures of magnetic materials using the NEMAD database. By augmenting the dataset with composition-based and domain-aware descriptors, we evaluate the performance of several machine learning models. We find that the Extra Trees Regressor delivers the best performance reaching an R^2 score of up to 0.85 $\pm$ 0.01 (cross-validated) for a balanced dataset. We employ the k-means clustering algorithm to gain insights into the performan...

ID: 2508.06996v1 cond-mat.mtrl-sci, cs.LG

arXiv PDF

📄 Generative Inversion for Property-Targeted Materials Design: Application to Shape Memory Alloys

2025-08-13

Авторы:

Cheng Li, Pengfei Danga, Yuehui Xiana, Yumei Zhou, Bofeng Shi, Xiangdong Ding, Jun Suna, Dezhen Xue

## Контекст Шездарные свойства материалов типа никели-титана (NiTi), такие как могущественная память формы и высокие пределы выносливости, делают их привлекательными для применения в медицине, авиации и теплоотводящих системах. Однако создание таких материалов с оптимальными свойствами, такими как высокая температура превращения и большой выход механической работы, остается сложной и недоступной задачей. Настоящее исследование ориентировано на развитие инновационного подхода к инверсионному проектированию материалов, применяя генеративную адверсарную сеть (GAN) в сочетании с моделью предсказания свойств. ## Метод Фреймворк использует претренированную модель GAN для генерации возможных композиций и процессных параметров NiTi-материалов, удовлетворяющих пользовательским критериям. Эта модель интегрирована с моделью предсказания свойств, что позволяет выполнять градиентное оптимизационное решение в пространстве латентных переменных. Этот подход позволяет генерировать наборы композиций и параметров, целесообразные для достижения заданных характеристик. Экспериментальная часть прикладывает усилия для верификации полученных решений через синтез и исследование новых типов NiTi-материалов. ## Результаты Проведенные эксперименты показали, что предложенный подход эффективен в инверсионном проектировании. Таким образом, был выделен материал Ni$_{49.8}$Ti$_{26.4}$Hf$_{18.6}$Zr$_{5.2}$, который достиг высокой температуры превращения в 404 градусов Цельсия, высокого выхода механической работы в размере 9.9 Ж/см³, трансформационной ентальпии в 43 Ж/г и малой термической гистереза в 29 градусов Цельсия. Эти характеристики превосходят те известных NiTi-материалов. Оптимизация процессов, включая замедленное распространение Zr и Hf, а также структурные изменения в материале, включая Ti$_2$Ni-тип припалиты и локализованные деформации, положительно сказываются на производительности. ## Значимость Результаты имеют перспективы в области материаловедения, особенно в разработке материалов с нетривиальными свойствами. Фреймворк GAN inversion может быть применен для других областей, таких как термоэлектрические материалы и материалы с термореактивными свойствами. Данный подход обеспечивает быстрое и точное проектирование материалов, уменьшая количество экспериментов и повышая производительность. ## Выводы Предлагаемый подход демонстрирует силу инверсионного проектирования в создании новых типов материалов с нацеленными свойствами. Открытые во

Annotation:

The design of shape memory alloys (SMAs) with high transformation temperatures and large mechanical work output remains a longstanding challenge in functional materials engineering. Here, we introduce a data-driven framework based on generative adversarial network (GAN) inversion for the inverse design of high-performance SMAs. By coupling a pretrained GAN with a property prediction model, we perform gradient-based latent space optimization to directly generate candidate alloy compositions and p...

ID: 2508.07798v1 cond-mat.mtrl-sci, cs.LG

arXiv PDF

Показано 31 - 40 из 46 записей