📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Marcus Schwarting, Logan Ward, Nathaniel Hudson, Xiaoli Yan, Ben Blaiszik, Santanu Chaudhuri, Eliu Huerta, Ian Foster

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Generative AI poses both opportunities and risks for solving inverse design problems in the sciences. Generative tools provide the ability to expand and refine a search space autonomously, but do so at the cost of exploring low-quality regions until sufficiently fine tuned. Here, we propose a queue prioritization algorithm that combines generative modeling and active learning in the context of a distributed workflow for exploring complex design spaces. We find that incorporating an active learni...
ID: 2509.25538v1 cs.LG, cond-mat.mtrl-sci, cs.AI
Авторы:

Evan Dramko, Yihuang Xiong, Yizhi Zhu, Geoffroy Hautier, Thomas Reps, Christopher Jermaine, Anastasios Kyrillidis

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Point defects play a central role in driving the properties of materials. First-principles methods are widely used to compute defect energetics and structures, including at scale for high-throughput defect databases. However, these methods are computationally expensive, making machine-learning force fields (MLFFs) an attractive alternative for accelerating structural relaxations. Most existing MLFFs are based on graph neural networks (GNNs), which can suffer from oversmoothing and poor represent...
ID: 2509.24115v1 cs.LG, cond-mat.mtrl-sci, math.OC, 68Q32 (Primary), 68T07 (Secondary)
Авторы:

Prabhat Karmakar, Sayan Gupta, Ilaksh Adlakha

#### Контекст Определить, как микроструктура влияет на механическое поведение гетерогенных материалов, является ключевым заданием в инженерных исследованиях. Тем не менее, данная задача остается сложной из-за высокой размерности и сложности микроструктур. Традиционные физико-математические модели, требующие высокого вычислительного затрат, не могут удовлетворительно рассматривать все возможные сценарии. Это вынуждает разрабатывать более эффективные алгоритмы, которые могут эффективно учитывать особенности микроструктуры. Предлагаемый подход становится важным в связи с ростом интереса к машинному обучению для прогнозирования механического поведения материалов. #### Метод Продвинутый подход, рассматриваемый в статье, основывается на развитии расширенной низкоранговой аппроксимации (xLRA), которая использует каноническое декомпозирование векторных пространств. Этот метод эффективно сокращает размерность высокомерных микроструктурных данных, при этом сохраняя важные микроструктурные детали. Алгоритм использует адаптивный подход для оптимизации ранга аппроксимации, позволяя достичь высокой точности с минимальным числом необходимых операций. Данный подход может обрабатывать данные с микроструктурными порогами, используя только 5% данных для тренировки. #### Результаты Эксперименты показали, что xLRA показывает выдающиеся результаты в прогнозировании локальных эластических полей в различных материальных системах, включая двухфазные композиты, а также поликристаллы одного и двух фаз. Точность прогнозирования остается высокой даже при низкой ранговой аппроксимации (максимально 4). Этот подход доказал важность в своей способности предсказывать механическую реакцию материалов с минимальными вычислительными затратами, а также в своей трансфертивности на различные материалы. #### Значимость Предлагаемый подход имеет широкие применения в инженерной механике, а также в области анализа микроструктурных свойств материалов. Он позволяет эффективно оптимизировать структуру материалов, при этом сокращая вычислительные затраты. Этот подход может быть применен в промышленных процессах, связанных с проектированием материалов, а также в улучшении дизайна новых материалов с высокой механической прочностью и другими свойствами. #### Выводы xLRA представляет собой мощный инструмент для анализа микроструктур, обеспечивая эффективное прогнозирование механического поведения материалов. Данный метод открывает новые возможности для создания компактных и точных моделей, которые могут быть
Annotation:
Predicting how the microstructure governs the mechanical response of heterogeneous materials is essential for optimizing design and performance. Yet this task remains difficult due to the complex, high dimensional nature of microstructural features. Relying on physics based simulations to probe the microstructural space is computationally prohibitive. This motivates the development of computational tools to efficiently learn structure property linkages governing mechanical behavior. While contem...
ID: 2509.20276v1 cs.LG, cond-mat.mtrl-sci
Авторы:

Shi Yin, Zujian Dai, Xinyang Pan, Lixin He

## Контекст Электронные структуры веществ широко исследуются в системах компьютерной томографии и виртуальной реальности. Одна из основных задач в этой области — точно определять характеристики материала с помощью гамильтониана. Традиционные методы, такие как DFT, требуют больших вычислительных ресурсов и времени. Нейронные сети, в свою очередь, демонстрируют высокую эффективность, но сталкиваются с проблемами общей обработки разнообразных молекулярных структур и высокомерности гамильтонианов. Это приводит к ошибкам в предсказаниях и нестабильности моделей. Необходимо развивать методы, которые обеспечивают сбалансированное соотношение точности и универсальности. ## Метод Для улучшения общей обработки и предсказания гамильтонианов мы предлагаем метод **NextHAM**. Он включает в себя несколько ключевых инноваций. Во-первых, мы используем **zeroth-step Hamiltonians** — начальные оценки гамильтониана, построенные на основе DFT-данных, чтобы упростить входно-выходное преобразование. Во-вторых, мы предлагаем **Transformer с строгую симметрию E(3)**, что обеспечивает высокую точность и гибкость в предсказаниях. В-третьих, мы разработали уникальный тренировочный функционал, который уменьшает ошибки в реальном и волновом пространстве, устраняя проблемы, такие как "призрачные состояния" из-за высокого условного числа матрицы преобразования. ## Результаты Мы проверили NextHAM на наборе данных **Materials-HAM-SOC**, включающем 17 000 структур материалов с 68 элементами. Модель достигла высокой точности в предсказании гамильтонианов и банд-структур. Наши результаты показывают, что NextHAM превосходит существующие подходы в скорости и точности. Является ли модель NextHAM лучшим вариантом для конкретного материала, или же это зависит от этапа решения или конкретной модели? ## Значимость NextHAM может применяться в различных областях, включая разработку материалов, энергетику и виртуальные материалы. Его главные преимущества — быстрота работы, универсальность и высокая точность. Этот подход открывает пути для более эффективных методов разработки материалов, уменьшения вычислительных затрат и повышения точности моделей в учебной практике. ## Выводы NextHAM представляет собой прорыв в области автоматизации предсказания гамильтониана материалов. Он оптимизирует процессы предсказания и уменьшает неточности, связанные с DFT. На будущее мы призваны дорабатывать модель, улучшая ее точность и обработку данных, а также расширять ее применение в различных областях.
Annotation:
Deep learning methods for electronic-structure Hamiltonian prediction has offered significant computational efficiency advantages over traditional DFT methods, yet the diversity of atomic types, structural patterns, and the high-dimensional complexity of Hamiltonians pose substantial challenges to the generalization performance. In this work, we contribute on both the methodology and dataset sides to advance universal deep learning paradigm for Hamiltonian prediction. On the method side, we prop...
ID: 2509.19877v2 cs.LG, cond-mat.mtrl-sci, cs.AI, physics.comp-ph
Авторы:

Dong Chen, Jian Liu, Chun-Long Chen, Guo-Wei Wei

## Контекст Porous materials играют ключевую роль в различных технологиях, включая хранение газа, сепарацию соединений и катализ. Их разнообразие структур и сложность межсвязи между локальными химическими окружениями и глобальными топологическими свойствами делает прогностическую моделирование их свойств высоко сложной. Эти проблемы усиливаются дефицитом тщательно отмеченных данных, что приводит к снижению общезначимости моделей. В этой работе мы адресуем эти затруднения, призваны разработать метод, который мог бы более эффективно анализировать и предсказывать свойства порных материалов. ## Метод Мы предлагаем Interaction Topological Transformer (ITT), данное решение объединяет в себе взаимодействия топологически и композиционно, чтобы трансформировать данные порных материалов на нескольких уровнях структуры. ITT использует возможности интегрированной архитектуры Transformera для анализа материалов на разных масштабах: структурных, элементарных, атомарных и парных элементов. Метод использует двухэтапную стратегию обучения: предварительное обучение с самостоятельным подкреплением на масштабных данных, а затем — оптимизация под конкретные задачи с учетом меток. Это позволяет ITT ловко адаптироваться к различным классам порных материалов с высокой точностью и переносимостью. ## Результаты Мы проводили эксперименты на широком наборе данных, включающих порные материалы с различными свойствами. ITT показал поразительную точность в предсказании характеристик, таких как адсорпция, транспортные свойства и стабильность. Также был проведен анализ взаимосвязи между локальными и глобальными факторами с помощью топологического представления. Эти результаты подтверждают высокую эффективность ITT в качестве общего инструмента для моделирования порных материалов. ## Значимость ITT может быть применен в различных областях, где критически важны порные материалы, включая энергетику, среды окружения и химическую промышленность. Его преимущества заключаются в своей способности анализировать сложные связи и предсказывать свойства на разных уровнях структуры, что повышает многоуровневую гибкость модели. Это может привести к ускорению исследований в области порных материалов, расширению практического применения и новым разработкам в этой области. ## Выводы ITT представляет собой новую, важную модель для моделирования порных материалов. Он адресует сложности многомерного моделирования и предоставляет новый способ для развития данной области. Будущие исследования будут сфокусированы на расширении ITT для других классов материалов и применении в ре
Annotation:
Porous materials exhibit vast structural diversity and support critical applications in gas storage, separations, and catalysis. However, predictive modeling remains challenging due to the multiscale nature of structure-property relationships, where performance is governed by both local chemical environments and global pore-network topology. These complexities, combined with sparse and unevenly distributed labeled data, hinder generalization across material families. We propose the Interaction T...
ID: 2509.18573v1 cs.LG, cond-mat.mtrl-sci, cs.AI
Авторы:

Jorge-Humberto Urrea-Quintero, David Anton, Laura De Lorenzis, Henning Wessels

```markdown ## Контекст В современной теории материалов исследование зависимостей между механическими нагрузками и материальными свойствами является ключевым заданием. Традиционный подход к построению и калибровке конститутивных моделей требует значительных усилий и сил, а также подвержден ошибкам и неопределенностям. В этой статье рассматривается альтернативный подход, основанный на автоматизированном обнаружении моделей, который может существенно упростить процесс и улучшить точность. Особенно актуальным этот подход становится в условиях появления больших данных и развития машинного обучения. ## Метод Авторы предлагают развитый фреймворк, который объединяет три различных алгоритма спарсе регрессии: LASSO, LARS и Orthogonal Matching Pursuit. Каждый алгоритм сочетается с тремя критериями моделирования: K-fold cross-validation, Akaike Information Criterion (AIC) и Bayesian Information Criterion (BIC). Это сочетание дает 9 разных вариантов алгоритмов для моделирования. LASSO используется для эффективного решения задачи с $\ell_1$-регуляризацией, а OMP является трактовательным методом для решения задач с $\ell_0$-регуляризацией. Фреймворк был применен для моделирования изотропных и анизотропных гипереластических материалов с использованием синтетических и экспериментальных данных. ## Результаты Эксперименты показали, что все 9 комбинаций алгоритмов и критериев моделирования демонстрируют высокую точность в обнаружении конститутивных моделей. Авторы отмечают, что алгоритмы с $\ell_0$-регуляризацией OMP дают похожие или даже лучшие результаты по сравнению с $\ell_1$-регуляризацией. Это позволяет расширить широту возможных подходов к моделированию, давая более гибкие и точные результаты. ## Значимость Разработанный фреймворк может быть применен в различных областях, таких как механика, материаловедение и инженерия, для автоматизированного построения конститутивных моделей. Он обеспечивает более высокую точность во время моделирования, улучшает процесс калибровки моделей и снижает трудоемкость работы. Также он может способствовать развитию интеллектуальных систем в области механики и системного проектирования. ## Выводы Результаты демонстрируют, что автоматизированные методы моделирования могут существенно упростить процесс построения и калибровки конститутивных моделей. Несмотря на то, что LASSO и другие методы с $\ell_1$-регуляризацией широко применяются, новые варианты с $\ell_0$-регуляризацией OMP показали себя как эффективные альтернативы. Будущие исследования будут сфокусированы на расширении фреймворка на более сложные ситуации и материалы. ```
Annotation:
The automated discovery of constitutive models from data has recently emerged as a promising alternative to the traditional model calibration paradigm. In this work, we present a fully automated framework for constitutive model discovery that systematically pairs three sparse regression algorithms (Least Absolute Shrinkage and Selection Operator (LASSO), Least Angle Regression (LARS), and Orthogonal Matching Pursuit (OMP)) with three model selection criteria: $K$-fold cross-validation (CV), Akai...
ID: 2509.16040v1 cs.LG, cond-mat.mtrl-sci, cs.CE
Авторы:

Hong Sun, Joshua A. Vita, Amit Samanta, Vincenzo Lordi

#### Контекст Исследование рассматривает область атомных данных в машинном обучении, специфичную для силовых полей. Одна из его ключевых проблем — преодоление семплинговой биаса при сборе данных, который может привести к переобучению моделей и неточным результатам. Традиционные методы, такие как кластеризация или приемление, часто неэффективны в высокомерных пространствах данных. Это приводит к утере информации или недостаточной разнообразию данных. Формирование составных и равномерных данных требует новых алгоритмов, которые могут эффективно обрабатывать высокомерные данные без потери точности или важности. #### Метод Предлагается модель Multi-kernel Edge Attention-based Graph Autoencoder (MEAGraph), основывающаяся на графовых автокодировщиках с многоядерными линейными трансформациями и аттестацией сообщений. Этот подход не требует меток данных и применяет несколько графовых преобразований для получения точных свойств атомных окружений. Аттестация сообщений позволяет усилить важные связи в графе, уменьшая шум и обеспечивая компактное представление. Модель использует многоядерную архитектуру для эффективного представления высокомерных данных и их анализа. #### Результаты Исследование проводилось на данных для моделирования ниобия, тантала и железа. Результаты показали, что MEAGraph эффективно группирует атомы с похожими окружениями, определяя ключевые регионы на потенциальной энергетической поверхности. Эффективность модели продемонстрирована в анализе и кластеризации, а также в удалении семплингового биаса. Отбор данных показал улучшение точности и общности моделей силовых полей, снижая влияние семплингового биаса. #### Значимость MEAGraph применим в различных областях, включая химию, материаловедение и синтетические исследования. Он позволяет создавать более равномерные и целостные данные, улучшая результаты моделирования и предсказания. Модель эффективно решает проблему семплингового биаса, уменьшая необходимость вручную исправлять данные. Это ведет к более устойчивым и точным моделям, которые могут экономить ресурсы в процессе моделирования. #### Выводы MEAGraph доказал свою эффективность в группировке атомных окружений и удалении семплингового биаса. Будущие исследования могут сфокусироваться на расширении модели для более сложных систем и интеграции с другими методами машинного обучения для силовых полей. Это может привести к более широкому применению в различных научных и технологических областях.
Annotation:
Constructing a chemically diverse dataset while avoiding sampling bias is critical to training efficient and generalizable force fields. However, in computational chemistry and materials science, many common dataset generation techniques are prone to oversampling regions of the potential energy surface. Furthermore, these regions can be difficult to identify and isolate from each other or may not align well with human intuition, making it challenging to systematically remove bias in the dataset....
ID: 2509.12358v1 cs.LG, cond-mat.mtrl-sci
Авторы:

Yonghao Weng, Liqiang Gao, Linwu Zhu, Jian Huang

## Контекст Исследование в области материаловедения характеризуется высоким уровнем специализации и требует сложных аналитических техник. Традиционные подходы часто требуют долгого обучения специалистов и значительных вычислительных ресурсов. На смену этим проблемам набирают обороты искусственные нейронные сети, включая гра larne language models (LLMs), которые показали свою мощь в общих задачах, таких как программирование и генерация текста. Однако их потенциал в специфичных задачах, таких как характеризация материалов, еще не подробно изучен. Данный текст посвящен предложению MatQnA, первого многомодального бенчмарк-датсета, специально разработанного для характеризации материалов. Он учитывает 10 основных методов, включая X-ray Photoelectron Spectroscopy (XPS), X-ray Diffraction (XRD) и Scanning Electron Microscopy (SEM). Задача MatQnA — создать комплексный инструмент для проверки готовности AI-моделей к применению в этой области. ## Метод MatQnA использует гибридный подход, комбинирующий глубокое обучение с ручной валидацией. Для построения датасета были собраны и анализированы крупномасштабные данные материалов, включая картинки, тексты и структуры. Методы характеризации были обработаны с помощью техник машинного обучения для получения высококачественных многомодальных примеров. Далее, чтобы обеспечить высокую точность и соответствие реальным задачам, датасет был проверен вручную с участием экспертов. Это привело к разработке 20,000 пар "вопрос-ответ", как в виде нескольких вариантов ответов, так и в виде свободного текста. Архитектура MatQnA основывается на многомодальном подходе, объединяющем текст, изображения и другие метрики, чтобы обеспечить широкий анализ. ## Результаты На этапе экспериментов были протестированы виды глубоких моделей, включая GPT-4.1, Claude 4, Gemini 2.5 и Doubao Vision Pro 32K. Эти модели были распространены на задачи интерпретации и анализа данных материалов. Результаты показали, что модели достигли близких к 90% точности при решении объективных задач, таких как идентификация материалов и оценка характеристик. У некоторых моделей были выявлены слабые места в тех случаях, когда необходимо было объяснение результата. Тем не менее, MatQnA показал мощь LLMs в сфере характеризации материалов, став первым широко измеренным датасетом, позволяющим проверить AI-модели в реальных условиях. ## Значимость MatQnA открывает новые возможности в задачах по характеризации материалов, предоставляя мощный инструмент для обучения и проверки AI-моделей. Он может использоваться в различных областях, включая промышленность
Annotation:
Recently, large language models (LLMs) have achieved remarkable breakthroughs in general domains such as programming and writing, and have demonstrated strong potential in various scientific research scenarios. However, the capabilities of AI models in the highly specialized field of materials characterization and analysis have not yet been systematically or sufficiently validated. To address this gap, we present MatQnA, the first multi-modal benchmark dataset specifically designed for material ...
ID: 2509.11335v1 cs.LG, cond-mat.mtrl-sci
Авторы:

Maya M. Martirossyan, Thomas Egg, Philipp Hoellmer, George Karypis, Mark Transtrum, Adrian Roitberg, Mingjie Liu, Richard G. Hennig, Ellad B. Tadmor, Stefano Martiniani

## Контекст Современные генерирующие модели для материалов, особенно иннорганических кристаллов, представляют потенциал для значительного теоретического прогресса в предсказании новых структур и составов. Однако развитие этой области напрямую зависит от качественных бенчмарков и информативных данных, которые обеспечивают целесообразное оценивание моделей. В последнее время широко используются подходы к синтезу и оценке материалов, но существуют значительные проблемы, включая недостаточность уникальных кристаллов, неэффективное деление на выборки и неточные метрики бенчмарков. Эти проблемы необходимо устранить для того, чтобы материаловедение и теоретический материалостроение достигли новых высот. ## Метод Для проблемы предсказания кристаллических структур (CRYSPRO), целесообразно использовать новые методологии, ориентированные на избавление от устаревших структурных метрик и применение мощных методов визуализации и анализа. Мы предлагаем новые методы группировки данных для отсечения неуникальных кристаллов и новые метрики, которые более точно отображают структурную разнообразность. Эти технические решения позволяют повысить качество моделей и ускорить инновационные исследования в области материалов. ## Результаты Мы провели эксперименты с популярными данными, включая сети глубинного обучения и методы бенчмаркинга. Например, удаление дубликатов из Carbon-24 дало повышение уникальности данных с 40% до 100%. Мы также предложили новый способ разбиения данных Perov-5, чтобы группировать полиморфы в каждой подвыборке. Эти изменения привели к улучшению качества предсказаний и более точным оценкам моделей. Новые метрики, такие как METRe и cRMSE, показали себя эффективнее стандартных метрик, таких как match rate. Эти результаты подтвердили значительное усовершенствование алгоритмов для предсказания кристаллических структур. ## Значимость Новые подходы к данным и метрикам могут быть применены в многих областях, включая синтез новых материалов, синтетическую химию, криологию и месторождения. Эти методы позволяют улучшить точность бенчмарков, уменьшить разброс результатов и повысить качество моделей. Это может привести к ускорению развития новых технологий и инноваций в промышленных, энергетических и экологических сферах. ## Выводы Проблемы с данными и метриками в материаловедении широко распространены, но их можно устранить с помощью усовершенствований в методологии и технических решениях. Мы предложили новую разметку данных, улучшенные метрики и подходы к разбиению выборок. Наши рабо
Annotation:
Generative models for materials, especially inorganic crystals, hold potential to transform the theoretical prediction of novel compounds and structures. Advancement in this field depends critically on robust benchmarks and minimal, information-rich datasets that enable meaningful model evaluation. This paper critically examines common datasets and reported metrics for a crystal structure prediction task$\unicode{x2014}$generating the most likely structures given the chemical composition of a ma...
ID: 2509.12178v1 cs.LG, cond-mat.mtrl-sci
Авторы:

Andy Xu, Rohan Desai, Larry Wang, Gabriel Hope, Ethan Ritz

#### Контекст Область исследования, посвященная разработке новых материалов, играет ключевую роль в продвижении технологий, таких как солнечные элементы, аккумуляторы и системы улавливания углекислого газа. Однако разработка новых материалов требует огромных затрат времени и ресурсов из-за зависимости от традиционных методов проб и ошибок. Это приводит к замедлению прогресса в технологическом развитии. Для ускорения этого процесса введена PLaID++, представляющая собой Large Language Model (LLM), который был призван усовершенствовать генерацию кристаллов с использованием новых методик. Эта модель является одной из первых попыток применить новые модели текстового представления к материаловедческим задачам. #### Метод PLaID++ создан на основе Qwen-2.5 7B, трехлингвого модели, которая была уже применена в области текстового представления для химических соединений. Модель была приведена к устойчивости и ориентирована на генерацию кристаллов с учетом свойств, которые можно контролировать. Тексты, используемые для генерации кристаллов, были представлены в новом формате, основанном на Wyckoff-позициях. Для улучшения стабильности и гибкости генерации использовалась методология Direct Preference Optimization (DPO), которая использует схему награждения для гарантии высокой стабильности и уникальности генерируемых кристаллов. #### Результаты Исследование охватило сравнение PLaID++ с другими подходами в области генерации кристаллов. На тестирующих выборках метод PLaID++ показал стабильность и уникальность кристаллов не только в условиях полного исключения других факторов, но и при условии задания желаемой структуры пространственных групп. Например, PLaID++ способен работать с учетом предпочтений пользователя и генерировать кристаллы со свойствами, заданными в задаче. Измерения производительности показали, что PLaID++ выполняет генерацию кристаллов с значительно большей устойчивостью и уникальностью, а также создает кристаллы с заданными свойствами пространственных групп на 115% и 50% лучше, соответственно, чем традиционные подходы. #### Значимость PLaID++ может быть применена в различных областях высоких технологий, включая разработку солнечных элементов, батареей и системы углекислого газа. Он значительно сокращает время необходимого для разработки материалов, уменьшая количество экспериментов на пробной площадке. Благодаря DPO-методу, PLaID++ позволяет управлять не только стабильностью, но и свойствами, такими как местонахождение в пространственных группах. Это открывает путь к более эффективному и целеустремленному поис
Annotation:
Discovering novel materials is critical for technological advancements such as solar cells, batteries, and carbon capture. However, the development of new materials is constrained by a slow and expensive trial-and-error process. To accelerate this pipeline, we introduce PLaID++, a Large Language Model (LLM) fine-tuned for stable and property-guided crystal generation. We fine-tune Qwen-2.5 7B to generate crystal structures using a novel Wyckoff-based text representation. We show that generation ...
ID: 2509.07150v1 cs.LG, cond-mat.mtrl-sci
Показано 21 - 30 из 38 записей