A Novel Recurrent Neural Network Framework for Prediction and Treatment of Oncogenic Mutation Progression

2509.12732v1 cs.LG, cs.CL, q-bio.QM 2025-09-18
Авторы:

Rishab Parthasarathy, Achintya Bhowmik

Резюме на русском

## Контекст Канцер остается вторым по распространенности причиной смерти в мире, с более чем 600 000 погибших в год в США. Одной из перспективных областей в борьбе с этой болезнью является путический анализ, который дает возможность понять, как развивается опухоль. Однако данный подход требует времени и ресурсов, так как основывается на лабораторных исследованиях, которые занимают много времени и стоимостью. В данной работе предлагается новый подход, основывающийся на искусственных нейронных сетях и машинном обучении, который позволит более эффективно прогнозировать развитие канцерогенных мутаций и рекомендовать лечение. ## Метод Работа основывается на использовании временных рядов и машинного обучения для прогнозирования прогрессирования мутаций. Для этого был создан новый алгоритм подготовки данных, который фильтрует ключевые мутации по их частоте во всемирной базе данных генома рака (TCGA). Эти данные подавались в расчет на Recurrent Neural Network (RNN) модель, которая прогнозировала серьезность рака. Далее, использовались предсказания RNN, полученные данные о мутациях и базы данных целей для лекарств, чтобы прогнозировать будущие мутации и рекомендовать возможные лечения. Данный подход включает в себя эффективную обработку данных, что позволяет выделить ключевые мутации в каждой стадии рака. ## Результаты Авторы провестили эксперименты, используя данные из базы TCGA. Модель показала высокую точность по ROC-кривым (до 60%), что соответствует уровню диагностики рака существующих методов. Ключевые мутации были выявлены в каждой стадии рака с помощью heatmaps, которые показывают частоту появления определенных генов. Таким образом, модель стала первой, которая предлагает эффективный и современный подход к прогнозированию рака и лечению без необходимости времени и бюджета для лабораторных исследований. ## Значимость Предложенная модель может быть использована в медицине для более точного прогнозирования рака и разработки лечения. Ее преимущество заключается в том, что она эффективна, не требует больших финансовых и временных затрат, а также может быть применена для разных видов рака. В будущем, этот подход может помочь улучшить диагностику, повысить точность прогнозирования и уменьшить время от диагноза до начала лечения. ## Выводы Работа представляет собой первый шаг к созданию эффективного и эффективного фреймворка для прогнозирования прогрессирования рака и рекомендации лечения. Дальнейшие исследования будут сконцентрированы на улучшении точности модели и расширении ее возможностей для других типов рака. Эта работа может стать основой для передовых ис

Abstract

Despite significant medical advancements, cancer remains the second leading cause of death, with over 600,000 deaths per year in the US. One emerging field, pathway analysis, is promising but still relies on manually derived wet lab data, which is time-consuming to acquire. This work proposes an efficient, effective end-to-end framework for Artificial Intelligence (AI) based pathway analysis that predicts both cancer severity and mutation progression, thus recommending possible treatments. The proposed technique involves a novel combination of time-series machine learning models and pathway analysis. First, mutation sequences were isolated from The Cancer Genome Atlas (TCGA) Database. Then, a novel preprocessing algorithm was used to filter key mutations by mutation frequency. This data was fed into a Recurrent Neural Network (RNN) that predicted cancer severity. Then, the model probabilistically used the RNN predictions, information from the preprocessing algorithm, and multiple drug-target databases to predict future mutations and recommend possible treatments. This framework achieved robust results and Receiver Operating Characteristic (ROC) curves (a key statistical metric) with accuracies greater than 60%, similar to existing cancer diagnostics. In addition, preprocessing played an instrumental role in isolating important mutations, demonstrating that each cancer stage studied may contain on the order of a few-hundred key driver mutations, consistent with current research. Heatmaps based on predicted gene frequency were also generated, highlighting key mutations in each cancer. Overall, this work is the first to propose an efficient, cost-effective end-to-end framework for projecting cancer progression and providing possible treatments without relying on expensive, time-consuming wet lab work.

Ссылки и действия

Связанные статьи

A Systematic Review on the Generative AI Applications in Human Medical Genomics

## Контекст Генетика и геномика человека являются ключевыми областями исследований, стремящимися раскрыть причины, естес...

2025-08-29