DeepMech: A Machine Learning Framework for Chemical Reaction Mechanism Prediction

2509.15872v1 physics.chem-ph, cs.AI, cs.LG 2025-09-23
Авторы:

Manajit Das, Ajnabiul Hoque, Mayank Baranwal, Raghavan B. Sunoj

Резюме на русском

## Контекст Предсказание шага за шагом реакций химических механизмов (CRM) является ключевым вопросом в химии и биологии, но представляет серьезные трудности. Традиционные подходы, основывающиеся на экспертных экспериментах или дорогостоящих вычислениях квантовой химии, часто ограничены в скорости и точности. С другой стороны, современные глубокие учебные алгоритмы, хотя и эффективны в некоторых задачах, нередко пропускают важные промежуточные шаги или генерируют некорректные результаты (hallucinations). Это снижает их надежность в приложениях, требующих точного предсказания механизмов реакций. Модель DeepMech предлагает решение этих проблем, обеспечивая интерпретируемую и точную модель для предсказания CRMs. ## Метод DeepMech является интерпретируемым графовым фреймворком на основе глубокого обучения, который применяет атом- и связь-уровневую активность. Модель работает под руководством шаблонов механистических операций (TMOps), которые являются предварительно определенными операциями, характеризующимися взаимодействиями между атомами и связями. Работа DeepMech основывается на крупномасштабной датасете ReactMech, состоящей из примерно 30 тысяч CRMs с 100 тысячю пересечением атомов и массового баланса в элементарных шагах. Эта модель обучается на предсказании элементарных шагов и CRMs в целом, включая способность предсказать сторонние и дополнительные продукты. Особое внимание уделяется точности и интерпретируемости результатов. ## Результаты Эксперименты показали, что DeepMech достигает до 98,98±0,12% точности в предсказании элементарных шагов и 95,94±0,21% в целом задаче CRM. Она показала высокую надежность в определении сторонних и дополнительных продуктов. Экстендированные эксперименты на многошаговых CRMs показали, что модель может эффективно восстанавливать пути от простой примитивной основы до сложных молекул, таких как серони и алдопентозы, демонстрируя свою применимость в задачах, связанных с предшествованием и преобразованием. ## Значимость Предлагаемая модель может быть применена в различных областях, включая химическое проектирование, промышленную химию и предшествование жизненных процессов. DeepMech обеспечивает высокую точность, интерпретируемость и универсальность, что делает её полезной для решения задач, связанных с оптимизацией и проектированием реакций. Исследования также открывают пути для последующих исследований в области глубокого обучения для задач химических механизмов. ## Выводы DeepMech представляет собой точную и интерпретируемую модель для пре

Abstract

Prediction of complete step-by-step chemical reaction mechanisms (CRMs) remains a major challenge. Whereas the traditional approaches in CRM tasks rely on expert-driven experiments or costly quantum chemical computations, contemporary deep learning (DL) alternatives ignore key intermediates and mechanistic steps and often suffer from hallucinations. We present DeepMech, an interpretable graph-based DL framework employing atom- and bond-level attention, guided by generalized templates of mechanistic operations (TMOps), to generate CRMs. Trained on our curated ReactMech dataset (~30K CRMs with 100K atom-mapped and mass-balanced elementary steps), DeepMech achieves 98.98+/-0.12% accuracy in predicting elementary steps and 95.94+/-0.21% in complete CRM tasks, besides maintaining high fidelity even in out-of-distribution scenarios as well as in predicting side and/or byproducts. Extension to multistep CRMs relevant to prebiotic chemistry, demonstrates the ability of DeepMech in effectively reconstructing pathways from simple primordial substrates to complex biomolecules such as serine and aldopentose. Attention analysis identifies reactive atoms/bonds in line with chemical intuition, rendering our model interpretable and suitable for reaction design.

Ссылки и действия

Связанные статьи

LoUQAL: Low-fidelity informed Uncertainty Quantification for Active Learning in ...

#### Контекст Уточнение неопределенности (унисе) — важная компонента активного обучения, особенно при прогнозировании к...

2025-08-23