HSA-Net: Hierarchical and Structure-Aware Framework for Efficient and Scalable Molecular Language Modeling
2508.08334v1
cs.LG, cs.AI, q-bio.QM
2025-08-14
Авторы:
Zihang Shao, Wentao Lei, Lei Wang, Wencai Ye, Li Liu
Резюме на русском
## Контекст
Molecular representation learning является основополагающей задачей для решения таких прикладных задач, как молекулярная капшн и предсказание молекулярных свойств. Несмотря на то, что Graph Neural Networks (GNN) стали одним из главных инструментов для этих задач, они сталкиваются со сложностями, в том числе проблемой over-smoothing, когда глубокие слои GNN приводят к схематизации функций узлов. Эта проблема особенно актуальна при работе с глубокими GNN-моделями. Несмотря на введение методов проекции функций с помощью cross-attention, они не всегда эффективно работают в глубоких слоях. Это побудило авторов исследовать альтернативные подходы, включая Граф-Mamba, но даже он не может успешно справиться с взаимодействием глобальных и локальных структур. Другими словами, существует глобально-локальное взаимодействие, которое необходимо учитывать. Мотивируясь этим, авторы предлагают HSA-Net — метод, который решает эту проблему.
## Метод
HSA-Net является инновационным фреймворком, основанным на двух модулях. Во-первых, **Hierarchical Adaptive Projector (HAP)** обеспечивает динамическую проекцию функций узлов, используя cross-attention для глубоких слоев и Graph-Mamba для локальных характеристик. Во-вторых, **Source-Aware Fusion (SAF)** включает в себя механизм выбора экспертов, который адаптивно объединяет проекции и учитывает характеристики этих проекций. Это позволяет HSA-Net эффективно объединять глобальные и локальные сведения, которые необходимы для точного и структурированного представления молекул.
## Результаты
Данные для экспериментов были получены из различных баз данных, таких как ZINC и QM9. На этих данных HSA-Net показал лучшие результаты по сравнению с состояниями искусства (SOTA) в задачах моделирования языка молекул. Точность предсказания молекулярных свойств и капшнов на порядок была выше. Эти результаты доказывают, что HSA-Net не только улучшает общую точность, но и способствует менее однородному представлению молекул, что важно для сложных задач моделирования.
## Значимость
HSA-Net может быть применен в различных областях, включая моделирование молекул, синтез молекул и другие аспекты химического проектирования. Основные преимущества в том, что он устраняет проблемы, связанные с глобально-локальным взаимодействием, и обеспечивает более точное представление молекул. Это может существенно повысить эффективность в таких областях, как молекулярный синтез или предсказание свойств. Будущие исследования могут ориентироваться на расширение HSA-Net для более широкого класса задач, включая биологические системы и стимулированные молекулярные симуляции.
## Выводы
HSA-Net устанавливает но
Abstract
Molecular representation learning, a cornerstone for downstream tasks like
molecular captioning and molecular property prediction, heavily relies on Graph
Neural Networks (GNN). However, GNN suffers from the over-smoothing problem,
where node-level features collapse in deep GNN layers. While existing feature
projection methods with cross-attention have been introduced to mitigate this
issue, they still perform poorly in deep features. This motivated our
exploration of using Mamba as an alternative projector for its ability to
handle complex sequences. However, we observe that while Mamba excels at
preserving global topological information from deep layers, it neglects
fine-grained details in shallow layers. The capabilities of Mamba and
cross-attention exhibit a global-local trade-off. To resolve this critical
global-local trade-off, we propose Hierarchical and Structure-Aware Network
(HSA-Net), a novel framework with two modules that enables a hierarchical
feature projection and fusion. Firstly, a Hierarchical Adaptive Projector (HAP)
module is introduced to process features from different graph layers. It learns
to dynamically switch between a cross-attention projector for shallow layers
and a structure-aware Graph-Mamba projector for deep layers, producing
high-quality, multi-level features. Secondly, to adaptively merge these
multi-level features, we design a Source-Aware Fusion (SAF) module, which
flexibly selects fusion experts based on the characteristics of the aggregation
features, ensuring a precise and effective final representation fusion.
Extensive experiments demonstrate that our HSA-Net framework quantitatively and
qualitatively outperforms current state-of-the-art (SOTA) methods.
Ссылки и действия
Дополнительные ресурсы: