Machine learning magnetism from simple global descriptors

2509.05909v1 cond-mat.mtrl-sci, cs.LG 2025-09-12
Авторы:

Ahmed E. Fahmy

Резюме на русском

## Контекст Магнетизм является одним из ключевых свойств материалов, которые имеют широкое приложение в различных технологиях. Одна из основных проблем в исследовании материалов с магнетизмом заключается в том, что многие существующие методы, такие как дифрактометрия расстояния (XRD) и панорамная электронная микроскопия (PEM), не всегда эффективно различают между разными типами магнетических структур. Это влечет за собой необходимость в развитии более точных и скоростных методов, которые могут быть использованы для выявления типов магнетизма в материалах. ## Метод Для решения этой проблемы в статье предлагается использовать машинное обучение для идентификации магнетических структур. Автор использует статистическую модель, построенную на данных, полученных при помощи DFT (другая модель, не DFT, может быть использована в качестве альтернативы). Модель обучается на данных из базы MAGNDATA, которая содержит магнетические структуры, проверенные экспериментально. Используются простые дескрипторы, включающие композиционные, структурные и электронные характеристики. Эти дескрипторы позволяют классифицировать типы магнетизма с высокой точностью. ## Результаты Результаты показали, что модель, обученная на данных MAGNDATA, достигает высокой точности в классификации структур (более 92%). Это значительно превышает результаты предыдущих исследований. Также был выявлен систематический биас в базе Materials Project, который склонен к более высокой доле ферромагнетических структур. Было также проведено сравнение с другими моделями, такими как LightGBM и XGBoost, которые показали точность в 84-86% при классификации магнетических классов. ## Значимость Нахождение новых материалов с магнетизмом является ключевым для развития новых технологий, включая электронные устройства, хранение энергии и медицинские приложения. Метод, представленный в статье, может быть использован для более точного и эффективного изучения магнетизма в материалах, уменьшая время и стоимость исследований. Более точные данные могут привести к развитию более надежных баз данных и ускорению исследований в этой области. ## Выводы Предложенный подход является эффективным для выявления типов магнетизма в материалах, особенно в больших материальных базах, как Materials Project. Однако, необходимо продолжить исследования для улучшения моделей и их применения в реальных условиях. Будущие исследования должны ориентироваться на расширение дескрипторов, улучшение точности моделей и их применение к другим типам магнетизма.

Abstract

The reliable identification of magnetic ground states remains a major challenge in high-throughput materials databases, where density functional theory (DFT) workflows often converge to ferromagnetic (FM) solutions. Here, we partially address this challenge by developing machine learning classifiers trained on experimentally validated MAGNDATA magnetic materials leveraging a limited number of simple compositional, structural, and electronic descriptors sourced from the Materials Project database. Our propagation vector classifiers achieve accuracies above 92%, outperforming recent studies in reliably distinguishing zero from nonzero propagation vector structures, and exposing a systematic ferromagnetic bias inherent to the Materials Project database for more than 7,843 materials. In parallel, LightGBM and XGBoost models trained directly on the Materials Project labels achieve accuracies of 84-86% (with macro F1 average scores of 63-66%), which proves useful for large-scale screening for magnetic classes, if refined by MAGNDATA-trained classifiers. These results underscore the role of machine learning techniques as corrective and exploratory tools, enabling more trustworthy databases and accelerating progress toward the identification of materials with various properties.

Ссылки и действия