Facet: highly efficient E(3)-equivariant networks for interatomic potentials
2509.08418v1
cond-mat.mtrl-sci, cs.LG
2025-09-12
Авторы:
Nicholas Miklaucic, Lai Wei, Rongzhi Dong, Nihang Fu, Sadman Sadeed Omee, Qingyang Li, Sourin Dey, Victor Fung, Jianjun Hu
Резюме на русском
#### Контекст
Модели машинного обучения (ML), предсказывающие энергии молекул или структур, являются важной частью современных исследований в области вычислительных материалов. Однако существуют значительные проблемы с их надёжностью и эффективностью. Одним из ключевых элементов является сохранение геометрических симметрий, таких как перестановки, повороты и сдвиги атомов. Эти симметрии требуют инвариантности или эквивариантности моделей к таким преобразованиям. Несмотря на развитие графных нейронных сетей (GNN), которые могут учитывать такие симметрии, они часто сталкиваются с проблемами эффективности и точности. Большая часть существующих моделей либо неэффективна, либо не может обеспечить необходимую точность в задачах, таких как прогнозирование характеристик материалов на основе геометрии ячейки кристалла.
#### Метод
Facet — это новая GNN-архитектура, разработанная с целью решения этих проблем. Она базируется на систематическом анализе существующих steerable GNNs и применении инновационных техник. Основным изобретением является замена дорогостоящих многослойных перцептронов (MLP) для обработки интераторных расстояний на более лёгкие сплайны, которые сохраняют точность но при этом уменьшают вычислительные и памятные нагрузки. Кроме того, разработана общеельно-целевая эквивариантная слоя, которая использует проекцию на сферическую решётку для перемешивания узловых данных и последующей обработки в стандартных MLP. Эта слой быстрее и более выразительна, чем существующие градиентные или гейт-слои.
#### Результаты
Facet протестирована на датасете MPTrj и сравнивалась с лидирующими методами. Она показала схожие результаты с меньшим числом параметров и значительно меньшим объёмом вычислительной нагрузки во время обучения. На задаче релаксации кристалла Facet работает в два раза быстрее, чем MACE-модели. Более того, проводились исследования на SevenNet-0, где удалось уменьшить число параметров на более чем 25% без потери точности. Эти результаты демонстрируют высокую эффективность и гибкость Facet в области ML-потенциалов.
#### Значимость
Facet открывает широкие возможности для эффективного машинного обучения в материаловедении. Она позволяет сократить сроки обучения больших моделей до 10 раз при сохранении высокой точности. Это может существенно повлиять на индустрию, снижая затраты на вычисления и увеличивая скорость открытия новых материалов. Будущие исследования могут сфокусироваться на расширении приложений Facet в прочие области, такие как квантовая химия и вычислительная б
Abstract
Computational materials discovery is limited by the high cost of
first-principles calculations. Machine learning (ML) potentials that predict
energies from crystal structures are promising, but existing methods face
computational bottlenecks. Steerable graph neural networks (GNNs) encode
geometry with spherical harmonics, respecting atomic symmetries -- permutation,
rotation, and translation -- for physically realistic predictions. Yet
maintaining equivariance is difficult: activation functions must be modified,
and each layer must handle multiple data types for different harmonic orders.
We present Facet, a GNN architecture for efficient ML potentials, developed
through systematic analysis of steerable GNNs. Our innovations include
replacing expensive multi-layer perceptrons (MLPs) for interatomic distances
with splines, which match performance while cutting computational and memory
demands. We also introduce a general-purpose equivariant layer that mixes node
information via spherical grid projection followed by standard MLPs -- faster
than tensor products and more expressive than linear or gate layers. On the
MPTrj dataset, Facet matches leading models with far fewer parameters and under
10% of their training compute. On a crystal relaxation task, it runs twice as
fast as MACE models. We further show SevenNet-0's parameters can be reduced by
over 25% with no accuracy loss. These techniques enable more than 10x faster
training of large-scale foundation models for ML potentials, potentially
reshaping computational materials discovery.