Nonparametric Reaction Coordinate Optimization with Histories: A Framework for Rare Event Dynamics

2508.07326v1 physics.chem-ph, cs.LG, math.PR, physics.comp-ph, q-bio.BM 2025-08-13
Авторы:

Polina V. Banushkina, Sergei V. Krivov

Резюме на русском

## Контекст Одним из главных областей интереса для современных научных исследований являются редкие, но критически важные события в сложных системах, таких как фолдинг белков, процессы реакций в химии, патогенез заболеваний, а также экстремальные климатические явления. Эти события часто происходят в высокомерном, стохастическом динамическом окружении, что делает их понимание и предсказание сложным. Центральной задачей в этой области является оптимизация реакционного координатного пространства (RC), которое позволяет лучше понять и моделировать динамику таких процессов. Несмотря на прогресс в методах оптимизации RC, существуют проблемы, связанные с неполными или неструктурированными данными, которые часто встречаются в реальных системах. Данная работа фокусируется на развитии методологии для точной и универсальной оптимизации RC, которая эффективна даже при ограниченных данных и нестандартных условиях. ## Метод Предлагаемый подход представляет собой непараметрическую модель оптимизации RC, которая использует историю динамических процессов для построения более точного и надежного координатного пространства. Алгоритм основан на методиках машинного обучения и адаптивной выборки, позволяя адаптироваться к различным условиям данных. Основная идея заключается в создании высоко точной модели RC, которая интерпретирует динамику системы и учитывает историю движения частиц. Метод также включает в себя многомерные анализы и методы выживания, чтобы обеспечить точность даже при неполных или шумных данных. Эта модель широко применима к разным системам, включая химические реакции, биологические процессы и климатические модели. ## Результаты Запуски алгоритма проводились на различных симуляционных данных, включая модели белкового фолдинга, модели химических реакций и модели клинических данных. В результате была получена высокая точность оценки коммиторных вероятностей (committor) и построения высокорезольвентных профилей свободной энергии. Эти результаты были проверены на строгих критериях валидации, показав высокую точность и надёжность разработанной модели. Также были проведены эксперименты на разных масштабах, включая модели вихревой системы и модели клинического анализа. Все эксперименты показали, что модель хорошо справляется с нетривиальными задачами, даже при отсутствии полного сэмплирования конфигурационного пространства. ## Значимость Разработанная методика имеет широкое применение в разных областях науки и техники, где требуется точное понимание редких и критически важных событий. Она может быть использована в биологии для анализа белкового фолдинга, в

Abstract

Rare but critical events in complex systems, such as protein folding, chemical reactions, disease progression, and extreme weather or climate phenomena, are governed by complex, high-dimensional, stochastic dynamics. Identifying an optimal reaction coordinate (RC) that accurately captures the progress of these dynamics is crucial for understanding and simulating such processes. This work introduces a nonparametric RC optimization framework that incorporates trajectory histories, enabling robust analysis even for irregular or incomplete data. The power of the method is demonstrated through increasingly challenging analyses of protein folding dynamics, where it provides accurate committor estimates that pass a stringent validation test and yield high-resolution free energy profiles. Its generality is further illustrated through applications to dynamics in phase space, a conceptual ocean circulation model, and a longitudinal clinical dataset. These results demonstrate that rare event dynamics can be accurately characterized without exhaustive sampling of the configuration space, establishing a general, flexible, and robust framework for analyzing complex dynamical systems and longitudinal datasets.

Ссылки и действия