RAPTOR-GEN: RApid PosTeriOR GENerator for Bayesian Learning in Biomanufacturing

2509.20753v1 stat.ML, cs.LG 2025-09-27
Авторы:

Wandi Xu, Wei Xie

Резюме на русском

## Контекст Biopharmaceutical manufacturing является ключевым вкладом в обеспечение общественного здравоохранения, однако сегодня оно сталкивается с проблемой неэффективности и недостаточной адаптивности в процессах производства биотерапевтических продуктов. Это связано с тем, что биопроцессы обусловлены сложностью и вариативностью, что затрудняет быструю переделку производственных установок и быстрое реагирование на неожиданные ситуации. Несмотря на развитие цифровых технологий, включая искусственный интеллект и машинное обучение, эти проблемы все еще не устранены. Для решения этой проблемы предлагается RAPTOR-GEN, новый подход, который объединяет механизмно-ориентированную методологию с технологиями машинного обучения, чтобы ускорить развитие цифровых двойников и повысить их точность и надёжность. ## Метод RAPTOR-GEN основывается на механизмно-информированной фреймворке машинного обучения с учётом природы биопроцессов, который использует теорию доминования воздействий и многомерные пространства возможностей для моделирования интерпретируемых структурных математических моделей. Фундаментальная концепция RAPTOR-GEN заключается в использовании пространства процессов, где каждый процесс представляется в виде многомерной модели, которая позволяет создавать высокоточные прогнозы. Также в RAPTOR-GEN включена технология проведения цифрового тестирования, которая позволяет быстро проверить различные сценарии без необходимости реальных экспериментов. Благодаря этому подходу можно эффективно использовать малое количество данных, обеспечивая надёжность и адаптивность в решении задач анализа и моделирования процессов в биопроизводстве. ## Результаты На основе RAPTOR-GEN был проведён набор экспериментов, где были использованы данные, полученные с реальных производственных установок. Эти данные были сгруппированы в многомерные модели, позволяющие проводить прогнозирование и анализ технологических процессов. Благодаря моделированию в RAPTOR-GEN, была достигнута высокая точность в оценке влияния различных параметров на производственный процесс. Также был проведён сравнительный анализ с другими методами, в котором RAPTOR-GEN показал значительное преимущество в скорости получения результатов и уменьшении ошибок. ## Значимость RAPTOR-GEN может применяться в различных сферах, начиная от биопроизводства и до технологий производства в других отраслях. Этот подход обеспечивает более быстрое и точное моделирование, что позволяет экономить время и ресурсы в процессах производства. Благодаря улучшенной моделированию процессов, RAPTOR-GEN позволяет увеличивать эффективность и надежность производ

Abstract

Biopharmaceutical manufacturing is vital to public health but lacks the agility for rapid, on-demand production of biotherapeutics due to the complexity and variability of bioprocesses. To overcome this, we introduce RApid PosTeriOR GENerator (RAPTOR-GEN), a mechanism-informed Bayesian learning framework designed to accelerate intelligent digital twin development from sparse and heterogeneous experimental data. This framework is built on a multi-scale probabilistic knowledge graph (pKG), formulated as a stochastic differential equation (SDE)-based foundational model that captures the nonlinear dynamics of bioprocesses. RAPTOR-GEN consists of two ingredients: (i) an interpretable metamodel integrating linear noise approximation (LNA) that exploits the structural information of bioprocessing mechanisms and a sequential learning strategy to fuse heterogeneous and sparse data, enabling inference of latent state variables and explicit approximation of the intractable likelihood function; and (ii) an efficient Bayesian posterior sampling method that utilizes Langevin diffusion (LD) to accelerate posterior exploration by exploiting the gradients of the derived likelihood. It generalizes the LNA approach to circumvent the challenge of step size selection, facilitating robust learning of mechanistic parameters with provable finite-sample performance guarantees. We develop a fast and robust RAPTOR-GEN algorithm with controllable error. Numerical experiments demonstrate its effectiveness in uncovering the underlying regulatory mechanisms of biomanufacturing processes.

Ссылки и действия