Advancing Universal Deep Learning for Electronic-Structure Hamiltonian Prediction of Materials
2509.19877v2
cs.LG, cond-mat.mtrl-sci, cs.AI, physics.comp-ph
2025-09-26
Авторы:
Shi Yin, Zujian Dai, Xinyang Pan, Lixin He
Резюме на русском
## Контекст
Электронные структуры веществ широко исследуются в системах компьютерной томографии и виртуальной реальности. Одна из основных задач в этой области — точно определять характеристики материала с помощью гамильтониана. Традиционные методы, такие как DFT, требуют больших вычислительных ресурсов и времени. Нейронные сети, в свою очередь, демонстрируют высокую эффективность, но сталкиваются с проблемами общей обработки разнообразных молекулярных структур и высокомерности гамильтонианов. Это приводит к ошибкам в предсказаниях и нестабильности моделей. Необходимо развивать методы, которые обеспечивают сбалансированное соотношение точности и универсальности.
## Метод
Для улучшения общей обработки и предсказания гамильтонианов мы предлагаем метод **NextHAM**. Он включает в себя несколько ключевых инноваций. Во-первых, мы используем **zeroth-step Hamiltonians** — начальные оценки гамильтониана, построенные на основе DFT-данных, чтобы упростить входно-выходное преобразование. Во-вторых, мы предлагаем **Transformer с строгую симметрию E(3)**, что обеспечивает высокую точность и гибкость в предсказаниях. В-третьих, мы разработали уникальный тренировочный функционал, который уменьшает ошибки в реальном и волновом пространстве, устраняя проблемы, такие как "призрачные состояния" из-за высокого условного числа матрицы преобразования.
## Результаты
Мы проверили NextHAM на наборе данных **Materials-HAM-SOC**, включающем 17 000 структур материалов с 68 элементами. Модель достигла высокой точности в предсказании гамильтонианов и банд-структур. Наши результаты показывают, что NextHAM превосходит существующие подходы в скорости и точности. Является ли модель NextHAM лучшим вариантом для конкретного материала, или же это зависит от этапа решения или конкретной модели?
## Значимость
NextHAM может применяться в различных областях, включая разработку материалов, энергетику и виртуальные материалы. Его главные преимущества — быстрота работы, универсальность и высокая точность. Этот подход открывает пути для более эффективных методов разработки материалов, уменьшения вычислительных затрат и повышения точности моделей в учебной практике.
## Выводы
NextHAM представляет собой прорыв в области автоматизации предсказания гамильтониана материалов. Он оптимизирует процессы предсказания и уменьшает неточности, связанные с DFT. На будущее мы призваны дорабатывать модель, улучшая ее точность и обработку данных, а также расширять ее применение в различных областях.
Abstract
Deep learning methods for electronic-structure Hamiltonian prediction has
offered significant computational efficiency advantages over traditional DFT
methods, yet the diversity of atomic types, structural patterns, and the
high-dimensional complexity of Hamiltonians pose substantial challenges to the
generalization performance. In this work, we contribute on both the methodology
and dataset sides to advance universal deep learning paradigm for Hamiltonian
prediction. On the method side, we propose NextHAM, a neural E(3)-symmetry and
expressive correction method for efficient and generalizable materials
electronic-structure Hamiltonian prediction. First, we introduce the
zeroth-step Hamiltonians, which can be efficiently constructed by the initial
charge density of DFT, as informative descriptors of neural regression model in
the input level and initial estimates of the target Hamiltonian in the output
level, so that the regression model directly predicts the correction terms to
the target ground truths, thereby significantly simplifying the input-output
mapping for learning. Second, we present a neural Transformer architecture with
strict E(3)-Symmetry and high non-linear expressiveness for Hamiltonian
prediction. Third, we propose a novel training objective to ensure the accuracy
performance of Hamiltonians in both real space and reciprocal space, preventing
error amplification and the occurrence of "ghost states" caused by the large
condition number of the overlap matrix. On the dataset side, we curate a
high-quality broad-coverage large benchmark, namely Materials-HAM-SOC,
comprising 17,000 material structures spanning 68 elements from six rows of the
periodic table and explicitly incorporating SOC effects. Experimental results
on Materials-HAM-SOC demonstrate that NextHAM achieves excellent accuracy and
efficiency in predicting Hamiltonians and band structures.