Advancing Universal Deep Learning for Electronic-Structure Hamiltonian Prediction of Materials

2509.19877v2 cs.LG, cond-mat.mtrl-sci, cs.AI, physics.comp-ph 2025-09-26
Авторы:

Shi Yin, Zujian Dai, Xinyang Pan, Lixin He

Резюме на русском

## Контекст Электронные структуры веществ широко исследуются в системах компьютерной томографии и виртуальной реальности. Одна из основных задач в этой области — точно определять характеристики материала с помощью гамильтониана. Традиционные методы, такие как DFT, требуют больших вычислительных ресурсов и времени. Нейронные сети, в свою очередь, демонстрируют высокую эффективность, но сталкиваются с проблемами общей обработки разнообразных молекулярных структур и высокомерности гамильтонианов. Это приводит к ошибкам в предсказаниях и нестабильности моделей. Необходимо развивать методы, которые обеспечивают сбалансированное соотношение точности и универсальности. ## Метод Для улучшения общей обработки и предсказания гамильтонианов мы предлагаем метод **NextHAM**. Он включает в себя несколько ключевых инноваций. Во-первых, мы используем **zeroth-step Hamiltonians** — начальные оценки гамильтониана, построенные на основе DFT-данных, чтобы упростить входно-выходное преобразование. Во-вторых, мы предлагаем **Transformer с строгую симметрию E(3)**, что обеспечивает высокую точность и гибкость в предсказаниях. В-третьих, мы разработали уникальный тренировочный функционал, который уменьшает ошибки в реальном и волновом пространстве, устраняя проблемы, такие как "призрачные состояния" из-за высокого условного числа матрицы преобразования. ## Результаты Мы проверили NextHAM на наборе данных **Materials-HAM-SOC**, включающем 17 000 структур материалов с 68 элементами. Модель достигла высокой точности в предсказании гамильтонианов и банд-структур. Наши результаты показывают, что NextHAM превосходит существующие подходы в скорости и точности. Является ли модель NextHAM лучшим вариантом для конкретного материала, или же это зависит от этапа решения или конкретной модели? ## Значимость NextHAM может применяться в различных областях, включая разработку материалов, энергетику и виртуальные материалы. Его главные преимущества — быстрота работы, универсальность и высокая точность. Этот подход открывает пути для более эффективных методов разработки материалов, уменьшения вычислительных затрат и повышения точности моделей в учебной практике. ## Выводы NextHAM представляет собой прорыв в области автоматизации предсказания гамильтониана материалов. Он оптимизирует процессы предсказания и уменьшает неточности, связанные с DFT. На будущее мы призваны дорабатывать модель, улучшая ее точность и обработку данных, а также расширять ее применение в различных областях.

Abstract

Deep learning methods for electronic-structure Hamiltonian prediction has offered significant computational efficiency advantages over traditional DFT methods, yet the diversity of atomic types, structural patterns, and the high-dimensional complexity of Hamiltonians pose substantial challenges to the generalization performance. In this work, we contribute on both the methodology and dataset sides to advance universal deep learning paradigm for Hamiltonian prediction. On the method side, we propose NextHAM, a neural E(3)-symmetry and expressive correction method for efficient and generalizable materials electronic-structure Hamiltonian prediction. First, we introduce the zeroth-step Hamiltonians, which can be efficiently constructed by the initial charge density of DFT, as informative descriptors of neural regression model in the input level and initial estimates of the target Hamiltonian in the output level, so that the regression model directly predicts the correction terms to the target ground truths, thereby significantly simplifying the input-output mapping for learning. Second, we present a neural Transformer architecture with strict E(3)-Symmetry and high non-linear expressiveness for Hamiltonian prediction. Third, we propose a novel training objective to ensure the accuracy performance of Hamiltonians in both real space and reciprocal space, preventing error amplification and the occurrence of "ghost states" caused by the large condition number of the overlap matrix. On the dataset side, we curate a high-quality broad-coverage large benchmark, namely Materials-HAM-SOC, comprising 17,000 material structures spanning 68 elements from six rows of the periodic table and explicitly incorporating SOC effects. Experimental results on Materials-HAM-SOC demonstrate that NextHAM achieves excellent accuracy and efficiency in predicting Hamiltonians and band structures.

Ссылки и действия