📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Neutron Reflectometry by Gradient Descent

2025-09-10

Авторы:

Max D. ~Champneys, Andrew J. ~Parnell, Philipp Gutfreund, Maximilian W. A. Skoda, . Patrick A. Fairclough, Timothy J. ~Rogers, Stephanie L. ~Burg

## Контекст Neutron reflectometry (NR) является важной методикой для исследования поверхностей и интерфейсов на уровне атомов. Она позволяет определять слои, толщину, расстояния между слоями, их грубость и другие характеристики. Однако NR является непрямой методикой, и получение физических параметров требует решения обратной задачи. Это особенно трудно при работе с многослойными структурами (например, в многослойных электродах литий-ионных батарей). Недавно, алгоритмы машинного обучения были предложены в качестве альтернативы стандартным оптимизационным методам. Тем не менее, эти подходы либо теряют физическую интуицию, либо требуют значительного вычислительного времени. В настоящей работе предлагается новый подход, основанный на решении задачи оптимизации прямой модели воспроизведения отраженных лучей с использованием градиентного спуска. ## Метод Метод заключается в использовании автоматической дифференциации для вычисления точных градиентов ошибки отраженного сигнала по отношению к параметрам модели (толщина слоев, скорость диффузии, грубость поверхности). Градиенты вычисляются непосредственно с использованием оптимизированных методов, таких как autograd в Python, что позволяет эффективно использовать градиентный спуск. Этот подход эффективен для больших наборов данных и сложных структур, таких как многослойные электроды батареек. Он позволяет вновь обнаружить возможности градиентных методов в области нейтронного отражения. ## Результаты Проведенные эксперименты показали, что градиентный спуск позволяет получать точные оценки параметров слоев в NR. Были проанализированы два случая: толстый кварцевый фильм и многослойная структура для OLED. В первом случае была достигнута высокая точность в определении толщины кварцевого слоя. Во втором случае достигнута хорошая связь между физическими параметрами и выходными данными, даже при высокой сложности данных. Это позволило доказать эффективность градиентного спуска в сложных задачах. ## Значимость Предложенная методика может быть применена в различных областях, где требуется точное определение слоев и их свойств. Она имеет высокую скорость и точность, что делает ее полезной для работы со сложными многослойными структурами, такими как электроды в литий-ионных батареях. Будущие исследования будут направлены на оптимизацию метода для работы с еще более сложными данными и интеграцию с другими методами в области нейтронного отражения. ## Выводы Предложенный подход представляет собой значительный шаг вперед в области нейтронного отражения. Он позволяет использовать мощные те

Annotation:

Neutron reflectometry (NR) is a powerful technique to probe surfaces and interfaces. NR is inherently an indirect measurement technique, access to the physical quantities of interest (layer thickness, scattering length density, roughness), necessitate the solution of an inverse modelling problem, that is inefficient for large amounts of data or complex multiplayer structures (e.g. lithium batteries / electrodes). Recently, surrogate machine learning models have been proposed as an alternative to...

ID: 2509.06924v1 cs.LG, cond-mat.mtrl-sci

arXiv PDF

📄 CbLDM: A Diffusion Model for recovering nanostructure from pair distribution function

2025-09-05

Авторы:

Jiarui Cao, Zhiyang Zhang, Heming Wang, Jun Xu, Ling Lan, Ran Gu

#### Контекст На сегодняшний день, проблема инверсного определения микроструктуры материалов является одной из самых актуальных задач в области физики и химии твердого тела. Она позволяет углубить понимание взаимосвязи между структурой и свойствами материалов на уровне наномасштаба. Одним из ключевых подходов является использование распределения парных функций (PDF) для восстановления микроструктуры. Несмотря на прогресс в этой области, существуют значительные проблемы, связанные с неэффективностью используемых методов и высокой точностью погрешности. Эта статья ориентирована на развитие новых подходов, которые могут решить эти проблемы и обеспечить более точное восстановление микроструктуры. #### Метод В этой работе предлагается модель **CbLDM (Condition-based Latent Diffusion Model)**, основанная на идеях латентных диффузионных моделей. В отличие от стандартных моделей, **CbLDM** использует условное представление для оценки постериорного распределения в рамках метода поддержки лобов. Это позволяет уменьшить количество шагов диффузии и, следовательно, повысить эффективность вычислений. Кроме того, вместо традиционного использования расстояний между точками в пространстве, в модели применяется граф-матрица Лапласиана для восстановления микроструктуры. Это решение уменьшает погрешность восстановления и улучшает точность модели. #### Результаты Для оценки эффективности **CbLDM** проведены обширные эксперименты с использованием реальных данных распределений парных функций. Модель была сравнена с другими популярными моделями, используемыми для решения задачи инверсного определения микроструктуры. Эксперименты показали, что **CbLDM** демонстрирует значительно более высокую точность предсказаний, что указывает на высокую эффективность этой модели в решении задачи наномасштабного восстановления структуры. Также было продемонстрировано, что модель может использоваться для решения других задач условной генерации. #### Значимость Результаты модели **CbLDM** имеют достаточно широкие применения в области нанотехнологий и физики твердого тела. Во-первых, модель позволяет более точно и эффективно восстанавливать микроструктуры наноматериалов, что имеет практическое значение для развития новых материалов и технологий. Во-вторых, модель может быть применена в других задачах условной генерации, таких как восстановление изображений и других полей на заданных условиях. Таким образом, **CbLDM** открывает новые возможности для усовершенствования технологий в указанных областях. #### Выводы **CbLDM** продемонстрировала свою эффективность в решении задачи

Annotation:

Nowadays, the nanostructure inverse problem is an attractive problem that helps researchers to understand the relationship between the properties and the structure of nanomaterials. This article focuses on the problem of using PDF to recover the nanostructure, which this article views as a conditional generation problem. This article propose a deep learning model CbLDM, Condition-based Latent Diffusion Model. Based on the original latent diffusion model, the sampling steps of the diffusion model...

ID: 2509.01370v1 cs.LG, cond-mat.mtrl-sci

arXiv PDF

📄 PDRL: Post-hoc Descriptor-based Residual Learning for Uncertainty-Aware Machine Learning Potentials

2025-09-05

Авторы:

Shih-Peng Huang, Nontawat Charoenphakdee, Yuta Tsuboi, Yong-Bin Zhuang, Wenwen Li

## Контекст Машинное обучение в области интерактивных моделей, например, в моделях графов и взаимодействия атомов, получило широкое распространение в современных исследованиях. Одной из ключевых задач в этой области является квантификация неопределенности (Uncertainty Quantification, UQ), которая определяет точность и надежность моделей. Несмотря на то, что методы построения конфиденциальных интервалов (Credible Interval Construction, CIC), такие как ensemble method, являются золотым стандартом для UQ в моделях графов, они часто связаны с высокой вычислительной сложностью. Более эффективные алгоритмы, такие как Monte Carlo dropout и deep kernel learning, используются для уменьшения затрат, но некоторые из них не подходят для уже обученных моделей, а другие могут снизить точность прогнозирования. Многие из этих методов требуют переобучения модели или использования дополнительных вычислительных ресурсов, что снижает их практическую эффективность. В данной работе предлагается простой и эффективный пост-хокк раммер (post-hoc framework) для UQ, который использует дескриптор, полученный из обученной модели графовой нейронной сети, для оценки ошибок прогноза. Этот метод, названный Post-Hoc Descriptor-Based Residual Learning (PDRL), может быть применен для вычисления прогностической неопределенности в уже обученных моделях, что делает его привлекательным для прикладных задач. ## Метод PDRL является простой пост-хокк моделью (post-hoc model), которая работает на основе дескрипторов, полученных из графовой нейронной сети. Основная идея заключается в том, чтобы оценивать ошибки прогноза (residuals), полученные из прогнозов модели, и использовать их в качестве признаков для оценки неопределенности. Для этого вводится новый функционал, основанный на резидуальной ошибке (residual-based functional), который позволяет моделировать неопределенность в моделировании. Метод может быть применен на предобученных моделях, не требуя их переобучения, что делает его эффективным в практических задачах. Архитектура PDRL включает в себя несколько модификаций, включая различные интерпретации резидуалов и функционалов, для точного моделирования неопределенности. Оптимизация результатов проводится с помощью градиентного спуска, чтобы подстроить модель под задачу. ## Результаты Для оценки PDRL проводились эксперименты на множестве данных, включая тренировочные и тестовые выборки, сравниваясь с другими методами UQ, такими как ensemble method, Monte Carlo dropout и deep kernel learning. Были изучены различные варианты PDRL, включая различные алгоритмы оценки резидуалов и их взаимодействие с графовой нейронной сетью. Результаты показали, что PDRL обеспечивает высокую точность оценки неопределенности с меньшими вычислительными затратами по сравнению с другими методами. Такж

Annotation:

Ensemble method is considered the gold standard for uncertainty quantification (UQ) for machine learning interatomic potentials (MLIPs). However, their high computational cost can limit its practicality. Alternative techniques, such as Monte Carlo dropout and deep kernel learning, have been proposed to improve computational efficiency; however, some of these methods cannot be applied to already trained models and may affect the prediction accuracy. In this paper, we propose a simple and efficien...

ID: 2509.02927v1 cs.LG, cond-mat.mtrl-sci

arXiv PDF

📄 CrystalICL: Enabling In-Context Learning for Crystal Generation

2025-08-30

Авторы:

Ruobing Wang, Qiaoyu Tan, Yili Wang, Ying Wang, Xin Wang

## Контекст Научное исследование CrystalICL: Enabling In-Context Learning for Crystal Generation посвящено развитию методов получения кристаллических материалов с желаемыми физико-химическими свойствами. Это задача значимости для материаловедения, так как кристаллы широко применяются в электронике, энергетике и других отраслях. Существующие подходы, основанные на больших языковых моделях (LLM), применяются в нулевом значении (zero-shot) и не могут воспользоваться преимуществами сценариев с несколькими примерами (few-shot). Это ограничение вводит парадокс: люди, разрабатывающие новые материалы, часто ориентируются на известные структуры, что схоже с ситуацией few-shot. Таким образом, нужны модели, которые могли бы эффективно использовать небольшое количество примеров для генерации кристаллических материалов. ## Метод Для решения этой проблемы CrystalICL предлагает новую методологию. Основным элементом является space-group based crystal tokenization, который упрощает моделирование симметрии кристаллов в языковых моделях. Далее, предлагается hybrid instruction tuning framework, который объединяет условия и структуры в одной модели, улучшая её способность понять отношение между свойствами и структурами. Эта модель также использует multi-task instruction tuning, что позволяет ей извлекать более глубокие связи между различными задачами. ## Результаты Исследования проводились на 4 бенчмарках для генерации кристаллов. CrystalICL показала сильное преимущество перед существующими методами в задачах условной и неусловной генерации. Эксперименты показали, что модель не только лучше работает в few-shot сценариях, но и выдает более качественные результаты при нулевом значении. Это свидетельствует о том, что CrystalICL не только справляется с текущими задачами, но и расширяет возможности моделей для генерации кристаллов. ## Значимость CrystalICL открывает новые горизонты в области материаловедения, позволяя эффективно использовать небольшие данные для построения кристаллов с нужными свойствами. Она может быть применена в разработке новых материалов для электроники, солнечных элементов и других приложений. Этот подход увеличивает точность и устойчивость генерации кристаллов, а также демонстрирует новые подходы для обучения с подкреплением (reinforcement learning) в материаловедении. ## Выводы CrystalICL доказала свою эффективность в решении задач генерации кристаллов. Будущие исследования будут направлены на улучшение точности генерации, добавление более широкого спектра примеров и исследование возможности применения данного подхода в реальных производственных условиях. Это может привести к новым перспективам в материаловедении и инновациях в технологиях.

Annotation:

Designing crystal materials with desired physicochemical properties remains a fundamental challenge in materials science. While large language models (LLMs) have demonstrated strong in-context learning (ICL) capabilities, existing LLM-based crystal generation approaches are limited to zero-shot scenarios and are unable to benefit from few-shot scenarios. In contrast, human experts typically design new materials by modifying relevant known structures which aligns closely with the few-shot ICL par...

ID: 2508.20143v1 cs.LG, cond-mat.mtrl-sci

arXiv PDF

📄 Beyond Optimization: Exploring Novelty Discovery in Autonomous Experiments

2025-08-29

Авторы:

Ralph Bulanadi, Jawad Chowdhury, Funakubo Hiroshi, Maxim Ziatdinov, Rama Vasudevan, Arpan Biswas, Yongtao Liu

########################## ## Контекст ########################## В настоящее время исследования в области автономных экспериментов (Autonomous Experiments, AEs) превратились в одно из самых продвинутых направлений в научных исследованиях. Используя сочетание искусственного интеллекта (AI) и автоматизированных экспериментальных платформ, AEs позволяют ускорять процесс открытия новых физических явлений. Однако, несмотря на их эффективность в оптимизации конкретных метрик, эти системы часто ограничиваются знакомыми результатами, недостаточно уделяя внимания выявлению неожиданных явлений, которые могут оказаться ключевыми для расширения границ науки. Таким образом, существует возникшая необходимость развития новых подходов, которые бы способствовали выявлению неожиданных феноменов в рамках автономных экспериментов. ########################## ## Метод ########################## Мы предлагаем **INS2ANE (Integrated Novelty Score-Strategic Autonomous Non-Smooth Exploration)**, новую методологию, которая целенаправленно расширяет границы традиционных подходов к автономным экспериментам. Метод основывается на двух главных компонентах: 1. **Новизна результатов (Novelty Score)**: система оценки, которая позволяет измерить уникальность и значимость результатов экспериментов, отличая их от традиционных результатов, которые могут быть предсказаны или ожидаемы. 2. **Стратегическая выборка (Strategic Sampling)**: механизм, который призывает эксперименты проводить в областях, которые, несмотря на их неочевидность, могут содержать необычные или неизвестные явления, и отклоняется от них в традиционных оптимизационных подходах. Эти компоненты объединены в интегрированную систему, которая направлена на расширение краевых случаев в экспериментальном пространстве, увеличивая степень исследований вне ограничений оптимизационных целей. ########################## ## Результаты ########################## Мы проводили ряд экспериментов для проверки INS2ANE, используя как синтетические данные с известным земным трUTHем, так и реальные данные из сканирующей микроскопии. Наши результаты показывают, что INS2ANE значительно увеличивает разнообразие обнаруженных феноменов в сравнении с традиционными методами оптимизации. Так, на примере сканирующей микроскопии, INS2ANE выявил новые физические явления, которые были пропущены при использовании традиционных подходов. Эта способность увеличить разнообразие результатов в значительной степени увеличивает шансы на открытие новых, ранее неизвестных физических явлений. ########################## ## Значимость ########################## Результаты INS2ANE открывают новые возможности в области научных исследований, позволяя не только ускорять оптимизацию, но и расширять границ

Annotation:

Autonomous experiments (AEs) are transforming how scientific research is conducted by integrating artificial intelligence with automated experimental platforms. Current AEs primarily focus on the optimization of a predefined target; while accelerating this goal, such an approach limits the discovery of unexpected or unknown physical phenomena. Here, we introduce a novel framework, INS2ANE (Integrated Novelty Score-Strategic Autonomous Non-Smooth Exploration), to enhance the discovery of novel ph...

ID: 2508.20254v1 cs.LG, cond-mat.mtrl-sci

arXiv PDF

📄 LeMat-Traj: A Scalable and Unified Dataset of Materials Trajectories for Atomistic Modeling

2025-08-29

Авторы:

Ali Ramlaoui, Martin Siron, Inel Djafar, Joseph Musielewicz, Amandine Rossello, Victor Schmidt, Alexandre Duval

## Контекст Для создания точных моделей атомных взаимодействий, основанных на машинном обучении (MLIPs), необходимы большие и качественные данные о атомных конфигурациях. Однако существующие данные, полученные с помощью теории квантовой механики (Density Functional Theory, DFT), часто разбросаны в разных открытых и платных репозиториях, имеют разные форматы и метаданные, что ограничивает их эффективность. Добыча таких данных требует серьезных вычислительных ресурсов, и их объединение становится сложной задачей. Наша мотивация заключается в создании универсального набора данных, который станет базой для эффективного обучения MLIPs и повышения их точности. ## Метод Мы предлагаем **LeMat-Traj**, собранный из более чем 120 миллионов атомных конфигураций, полученных из трех крупных репозиториев: Materials Project, Alexandria и OQMD. Данные тщательно проверены и стандартизированы по формату, позволяя легко использовать их в обучении MLIPs. Добавляются оба типа конфигураций: с относительно низким энергетическим содержанием и с высоким уровнем силы. Для удобства исследователей разработана **LeMaterial-Fetcher** — модульная библиотека для получения и обработки данных. Эта библиотека позволяет добавлять новые источники данных и гарантировать повторяемость работ. ## Результаты Мы провели эксперименты, обучая MLIPs на LeMat-Traj и сравнивая их с другими подходами. Наш набор данных позволяет значительно сократить ошибки в предсказании сил, особенно при задачах релаксации. Библиотека LeMaterial-Fetcher позволила создать прозрачную и открытую инфраструктуру для работы с данными, что привлекло участие сообщества в развитии датасета. ## Значимость LeMat-Traj значительно упрощает процесс обучения MLIPs, обеспечивая доступ к большому, стандартизированному набору данных. Это вносит значительный вклад в развитие точных моделей, что может применяться в материаловедении, энергетике и химии. Библиотека LeMaterial-Fetcher, в свою очередь, позволяет улучшать и расширять датасет, создавая прозрачные инструменты для сообщества. ## Выводы Представленный набор данных LeMat-Traj и библиотека LeMaterial-Fetcher являются ключевыми инструментами для развития MLIPs. Мы наблюдаем существенную повышенную точность моделей и снижение ошибок в предсказании сил. Будущие исследования будут направлены на расширение датасета, внедрение новых функционалов DFT и исследование новых методов обучения MLIPs.

Annotation:

The development of accurate machine learning interatomic potentials (MLIPs) is limited by the fragmented availability and inconsistent formatting of quantum mechanical trajectory datasets derived from Density Functional Theory (DFT). These datasets are expensive to generate yet difficult to combine due to variations in format, metadata, and accessibility. To address this, we introduce LeMat-Traj, a curated dataset comprising over 120 million atomic configurations aggregated from large-scale repo...

ID: 2508.20875v1 cs.LG, cond-mat.mtrl-sci

arXiv PDF

📄 Physics-informed neural network for fatigue life prediction of irradiated austenitic and ferritic/martensitic steels

2025-08-27

Авторы:

Dhiraj S Kori, Abhinav Chandraker, Syed Abdur Rahman, Punit Rathore, Ankur Chauhan

#### Контекст Напряженно-деформированные циклы в реакторах на обычном углеволевом стали приводят к появлению трещинообразных дефектов, что означает необходимость достоверно предсказывать их жизнь. Однако традиционные методы, такие как линейные теории разрушения или нейросетевые модели без физических ограничений, не достаточно точно изменяются в зависимости от сложной структуры материалов и их взаимодействия с радиацией в условиях высокой температуры. Это создает проблему в точном предсказании жизни материалов, что необходимо для безопасного и эффективного эксплуатации реакторов. #### Метод Предложенный Physics-Informed Neural Network (PINN) фреймворк интегрирует физические законы в процесс обучения, используя лимиты жизни специального формата для фатigue life. Он включает в себя физические зависимости, такие как изменение жизни при различных стадиях радиационного воздействия и температурных условий. Модель обучается на 495 данных, относящихся к как ириданным, так и неитоговым материалам, что обеспечивает широкое распространение и точность. Для выявления влияющих факторов использована SHapley Additive exPlanations (SHAP) аналитика. #### Результаты Проведенные эксперименты показали, что PINN превосходит существующие модели, включая Random Forest, Gradient Boosting, XGBoost и обычные нейросети по метрикам точности и общей достоверности. Особенно значительным является правильное предсказание жизни при высоких значениях напряжения и ирадиационного воздействия, где традиционные модели часто неверно оценивают жизнь. Кроме того, PINN показал специфическую зависимость жизни от ирадиационного воздействия, что соответствует физическим ожиданиям. #### Значимость Наиболее применимая область для PINN — это прогнозирование жизни изделий, работающих в условиях высокой температуры и радиационного воздействия, таких как реакторы на обычном углеволовом стали. Это не только повышает точность, но и обеспечивает интерпретируемость результатов. Более того, данный подход может быть использован для оптимизации материалов при разработке будущих технологий для ядерных энергетических систем. #### Выводы PINN-модель оказалась эффективной для сложных задач, таких как предсказание жизни сталей в условиях высокой температуры и радиации. Она представляет собой надежный инструмент для повышения надежности и эффективности ядерных реакторов. На будущие исследования планируется расширить модель, включив дополнительные физические факторы и расширив диапазон применения на другие типы материалов.

Annotation:

This study proposes a Physics-Informed Neural Network (PINN) framework to predict the low-cycle fatigue (LCF) life of irradiated austenitic and ferritic/martensitic (F/M) steels used in nuclear reactors. These materials experience cyclic loading and irradiation at elevated temperatures, causing complex degradation that traditional empirical models fail to capture accurately. The developed PINN model incorporates physical fatigue life constraints into its loss function, improving prediction accur...

ID: 2508.17303v1 cs.LG, cond-mat.mtrl-sci

arXiv PDF

📄 Comparison of derivative-free and gradient-based minimization for multi-objective compositional design of shape memory alloys

2025-08-22

Авторы:

S. Josyula, Y. Noiman, E. J. Payton, T. Giovannelli

## Контекст Шапокльниково-Хасемантовы металлы (Shape Memory Alloys, SMAs) широко применяются в различных отраслях, включая медицину, промышленность и аэрокосмическое производство, благодаря их уникальным свойствам, таким как форму changе и обратное тепловое воздействие. Однако оптимизация композиции SMAs для достижения желаемых пропертей, таких как мартенситная начальная температура (Ms), при сохранении высокой эффективности и устойчивости, представляет собой сложную задачу. Недостаток достоверных данных и высокая сложность моделей часто приводят к ограниченным результатам при использовании традиционных методов. В данном исследовании мы исследуем сравнительную эффективность дифференцируемых и недифференцируемых методов оптимизации для решения этой задачи. ## Метод Для оптимизации композиции SMAs мы применяем модели машинного обучения в качестве суррогатных предикторов, а именно дерево-основый решатель и нейронную сеть. Модели обучаются на наборе экспериментального характера по условиям металлов, а также используется физически информированная фичеризация. Для нерешательного поиска используется алгоритм COBYLA, который не требует дифференцируемости функции целевой. Для нейронной сети применяется градиентный метод TRUST-CONSTR, который работает с полученными градиентами модели. Оба метода применяются к задаче минимизации затрат при достижении целевого Ms. ## Результаты Экспериментальные результаты показали, что модель градиентного подхода (TRUST-CONSTR) показывает более стабильное поведение и способность достигать целевых точек, в то время как нерешательный подход (COBYLA) часто приводит к субоптимальным результатам, особенно при начальных гипотезах, отдаленных от целевой точки. Использование нейронной сети в качестве предиктора с градиентным подходом приводит к более надежной оптимизации, поскольку оно предоставляет дополнительные информационные сигналы для поиска оптимальных решений. ## Значимость Наш подход может быть применен для оптимизации композиции SMAs, а также других материалов, где необходимо сбалансировать противоречивые цели, такие как уменьшение затрат и достижение требуемых пропертей. Нейронные сети с градиентным подходом могут быть полезны в ситуациях, когда доступно малое количество экспериментальных данных, но требуется высокая точность моделирования. Это исследование демонстрирует ценность использования искусственного интеллекта для решения задач оптимизации в материаловедении. ## Выводы Мы демонстрируем, что градиентные методы оптимизации, использующие градиентную информацию модели, более эффективны для поиска оптимальных

Annotation:

Designing shape memory alloys (SMAs) that meet performance targets while remaining affordable and sustainable is a complex challenge. In this work, we focus on optimizing SMA compositions to achieve a desired martensitic start temperature (Ms) while minimizing cost. To do this, we use machine learning models as surrogate predictors and apply numerical optimization methods to search for suitable alloy combinations. We trained two types of machine learning models, a tree-based ensemble and a neura...

ID: 2508.14127v1 cs.LG, cond-mat.mtrl-sci, math.OC

arXiv PDF

Показано 31 - 38 из 38 записей