📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня

📄 Transforming Multi-Omics Integration with GANs: Applications in Alzheimer's and Cancer

2025-10-25

Авторы:

Md Selim Reza, Sabrin Afroz, Mostafizer Rahman, Md Ashad Alam

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Multi-omics data integration is crucial for understanding complex diseases, yet limited sample sizes, noise, and heterogeneity often reduce predictive power. To address these challenges, we introduce Omics-GAN, a Generative Adversarial Network (GAN)-based framework designed to generate high-quality synthetic multi-omics profiles while preserving biological relationships. We evaluated Omics-GAN on three omics types (mRNA, miRNA, and DNA methylation) using the ROSMAP cohort for Alzheimer's disease...

ID: 2510.19870v1 q-bio.QM, cs.LG, stat.ML

arXiv PDF

📄 Compressing Biology: Evaluating the Stable Diffusion VAE for Phenotypic Drug Discovery

2025-10-25

Авторы:

Télio Cropsal, Rocío Mercado

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

High-throughput phenotypic screens generate vast microscopy image datasets that push the limits of generative models due to their large dimensionality. Despite the growing popularity of general-purpose models trained on natural images for microscopy data analysis, their suitability in this domain has not been quantitatively demonstrated. We present the first systematic evaluation of Stable Diffusion's variational autoencoder (SD-VAE) for reconstructing Cell Painting images, assessing performance...

ID: 2510.19887v1 q-bio.QM, cs.LG

arXiv PDF

📄 PRISM: Enhancing Protein Inverse Folding through Fine-Grained Retrieval on Structure-Sequence Multimodal Representations

2025-10-16

Авторы:

Sazan Mahbub, Souvik Kundu, Eric P. Xing

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Designing protein sequences that fold into a target three-dimensional structure, known as the inverse folding problem, is central to protein engineering but remains challenging due to the vast sequence space and the importance of local structural constraints. Existing deep learning approaches achieve strong recovery rates, yet they lack explicit mechanisms to reuse fine-grained structure-sequence patterns that are conserved across natural proteins. We present PRISM, a multimodal retrieval-augmen...

ID: 2510.11750v1 q-bio.QM, cs.LG

arXiv PDF

📄 SeFEF: A Seizure Forecasting Evaluation Framework

2025-10-15

Авторы:

Ana Sofia Carmo, Lourenço Abrunhosa Rodrigues, Ana Rita Peralta, Ana Fred, Carla Bentes, Hugo Plácido da Silva

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

The lack of standardization in seizure forecasting slows progress in the field and limits the clinical translation of forecasting models. In this work, we introduce a Python-based framework aimed at streamlining the development, assessment, and documentation of individualized seizure forecasting algorithms. The framework automates data labeling, cross-validation splitting, forecast post-processing, performance evaluation, and reporting. It supports various forecasting horizons and includes a m...

ID: 2510.11275v1 q-bio.QM, cs.LG

arXiv PDF

📄 Decoding the dark proteome: Deep learning-enabled discovery of druggable enzymes in Wuchereria bancrofti

2025-10-12

Авторы:

Shawnak Shivakumar, Jefferson Hernandez

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Wuchereria bancrofti, the parasitic roundworm responsible for lymphatic filariasis, permanently disables over 36 million people and places 657 million at risk across 39 countries. A major bottleneck for drug discovery is the lack of functional annotation for more than 90 percent of the W. bancrofti dark proteome, leaving many potential targets unidentified. In this work, we present a novel computational pipeline that converts W. bancrofti's unannotated amino acid sequence data into precise four-...

ID: 2510.07337v1 q-bio.QM, cs.LG, q-bio.MN

arXiv PDF

📄 TF-DWGNet: A Directed Weighted Graph Neural Network with Tensor Fusion for Multi-Omics Cancer Subtype Classification

2025-09-24

Авторы:

Tiantian Yang, Zhiqian Chen

#### Контекст Интеграция и анализ мульти-омиковских данных являются ключевыми задачами в области раннего выявления и классификации рака. Однако эти данные часто являются высокомерностными, сложными и неструктурированными. Ранее развитые методы не могут полностью учесть структуру и связи внутри и между модальностями данных. Это приводит к ограниченной точности классификации и пониженной толерантности к искажениям в данных. Модели, основанные на графах, оказались эффективными для моделирования таких зависимостей. Однако, существующие графические модели либо не учитывают направленность и веса ребер, либо не эффективны в учете взаимосвязей между модальностями. Задача классификации подтипов рака требует методов, которые могут лучше учитывать направленность, связи и важность входных модальностей. #### Метод Мы предлагаем TF-DWGNet — метод, который сочетает графовую модель с направленными весами и тензорной функцией для объединения модальностей данных. Узлы графа представляют модальности данных, а ребра соответствуют взаимосвязям. TF-DWGNet построен на двух ключевых компонентах: 1. **Дерево-ориентированное построение графа**: это подход, который позволяет создавать направленные и взвешенные графы, учитывая направленность и силу связей между модальностями данных. 2. **Тензорная функция**: это механизм, который позволяет объединять информацию от отдельных модальностей, а также взаимодействий между ними, используя методы низкоранговой декомпозиции тензора. Этот подход позволяет TF-DWGNet эффективно обрабатывать высокомерные и нелинейные зависимости в мульти-омиковских данных, учитывая направленность и важность каждой модальности. #### Результаты TF-DWGNet протестирован на нескольких реальных датасетах рака. Для экспериментов мы использовали данные о выражении генов, микроаррай-данные и данные о метастазах. Метод показал высокую точность классификации подтипов рака по сравнению с состоянием искусственного интеллекта. Мы также провели эксперименты для оценки влияния каждой модальности и отдельных функций. Таким образом, TF-DWGNet демонстрирует более высокую точность классификации и позволяет понять, как именно каждая модальность вкладывается в решение. #### Значимость TF-DWGNet имеет широкое применение в области медицины, особенно для классификации рака и других заболеваний. Он позволяет выделить сильные и слабые модальности, что может помочь в выявлении новых биологических механизмов в раке. Этот подход также может быть применен для развития новых фармакологических средств, основанных на точных классификационных моделях

Annotation:

Integration and analysis of multi-omics data provide valuable insights for cancer subtype classification. However, such data are inherently heterogeneous, high-dimensional, and exhibit complex intra- and inter-modality dependencies. Recent advances in graph neural networks (GNNs) offer powerful tools for modeling such structure. Yet, most existing methods rely on prior knowledge or predefined similarity networks to construct graphs, which are often undirected or unweighted, failing to capture th...

ID: 2509.16301v1 q-bio.QM, cs.LG, 62R07

arXiv PDF

📄 Unleashing the power of computational insights in revealing the complexity of biological systems in the new era of spatial multi-omics

2025-09-19

Авторы:

Zhiwei Fan, Tiangang Wang, Kexin Huang, Binwu Ying, Xiaobo Zhou

## Контекст Новые технологии спатиальных омников позволяют изучать биологические системы с дополнительной точностью, сохраняя пространственную контекстность молекулярных измерений. Эти технологии раскрывают природу ячеистой неоднородности, тканевой архитектуры и динамических биологических процессов. Они применяются в развивающейся биологии, нейробиологии, онкологии и эволюционных исследованиях. Тем не менее, сложность системных данных требует продвинутых методов компьютерного анализа. Эта статья приводит обзор недавнikh достижений в технологиях и алгоритмах, способствующих глубокому пониманию структур и механизмов развития млекопитающих органов, а также роли молекулярных сигналов в онкогенезе и метастазах. Она также объясняет, как моделирование широкомасштабных данных молекулярных типов облегчает разбор процессов регуляции в организме. ## Метод Разработка компьютерных методов включает в себя алгоритмы машинного обучения для интеграции многообразия пространственных данных и выделения ключевых молекулярных сигналов. Технологии включают методы многоканальной сегментации, многомерную регрессию и семантический анализ слоёв данных. Архитектура включает в себя нейронные сети с глубоким слоями, многообразные способы визуализации и множественные модели интеграции данных. Эти подходы позволяют визуализировать тканевые структуры, распознавать клетки и отслеживать динамику процессов, таких как онтогенез и морфогенез тканей. ## Результаты Использование новых методов позволило выявить новые регуляторные сети и молекулярные сигналы, связанные с развитием органов, таких как печень и сердце. Алгоритмы отлично справлялись с распознаванием клеток, отслеживанием динамических сетей и распределением клеток в развивающихся тканях. Экспериментальные данные включали массивы секвенирования генов, темпоральные данные и пространственные модели. В результате были выявлены новые молекулярные сети, которые могут управлять процессами воспроизводства и регуляции тканей. ## Значимость Применение спатиальных омников и интегрированных моделей может опередить стандартные методы в диагностике, терапии и прогнозировании патологических состояний. Например, в онкологии они позволяют раскрыть процессы метастаза, определяя генетические и молекулярные сигналы, влияющие на распространение рака. В перспективе, эти технологии могут быть использованы для тщательного изучения типов тканей в развивающихся организмов, поиска целей для новых лекарств и создания моделей био

Annotation:

Recent advances in spatial omics technologies have revolutionized our ability to study biological systems with unprecedented resolution. By preserving the spatial context of molecular measurements, these methods enable comprehensive mapping of cellular heterogeneity, tissue architecture, and dynamic biological processes in developmental biology, neuroscience, oncology, and evolutionary studies. This review highlights a systematic overview of the continuous advancements in both technology and com...

ID: 2509.13376v1 q-bio.QM, cs.LG

arXiv PDF

📄 Predicting Antimicrobial Resistance (AMR) in Campylobacter, a Foodborne Pathogen, and Cost Burden Analysis Using Machine Learning

2025-09-05

Авторы:

Shubham Mishra, The Anh Han, Bruno Silvester Lopes, Shatha Ghareeb, Zia Ush Shamszaman

## Контекст Антимикробная резистентность (AMR) является критической проблемой для здравоохранения и экономики, приводя к усложнению лечения инфекций, увеличению затрат и сокращению эффективности антибиотиков. Особенно важной является проблема AMR в Campylobacter spp., широко распространенных пищеводных патогенах, вызывающих campylobacteriosis. Эта болезнь широко распространена в мире и является поводом для немалого количества посещений врачей и антибиотикотерапии. Традиционные методы диагностики AMR часто ограничены по времени и ресурсам. Машинное обучение предлагается как альтернативный подход для точного и быстрого определения AMR. Целью этого исследования является разработка и оценка модели машинного обучения для прогнозирования AMR в Campylobacter jejuni и Campylobacter coli, а также оценка экономических последствий AMR на здравоохранение. ## Метод Данных для исследования по статистике Campylobacter spp. из Британии посредством геномного секвенирования в ходе временных рядов обработки были получены из PubMLST, Food Standards Agency, и Food Standards Scotland. Модель Random Forest была обучена для прогнозирования AMR, принимая во внимание показатели клинической резистентности и генетические маркеры, такие как мутации в gyrA для противостояния флуороквинолам и синтагма tet(O) для противостояния тетрациклина. Для прогнозирования временных рядов campylobacteriosis использовались SARIMA, SIR, и Prophet. Для уточнения прогнозов использовались дополнительные данные о временных рядах, погрешность и тренды резистентности. ## Результаты Проведенные эксперименты показали, что модель Random Forest обеспечивает достаточную точность в прогнозировании AMR в Campylobacter — 74% при проверке на 1,000 бутстреп-выборках. Модели временных рядов прогнозировали повышение частоты campylobacteriosis до более чем 130 случаев на 100,000 человек к 2050 году, с прогнозируемыми затратами на лечение и производство продуктов питания, превышающими 1.9 миллиарда фунтов стерлингов в год, если не будут приняты меры. Расширенная модель Random Forest улучшила прогнозы, анализируя 6,683 изолятов, подтвердив высокую резистентность к бета-лактамам, возрастающую резистентность к флуороквинолам и переменную резистентность к тетрациклинам. ## Значимость Результаты имеют потенциал для использования в амбулаторных и больничных условиях для точного диагностирования AMR и выбора эффективного антибиотика. Модели могут поддерживать масштабные выстраивания прогнозов AMR и снижения рисков здоровью населения. Экономические потери, связанные с AMR, могут быть существенно снижены, если будут применены рекомендации моделей. ## Выводы Разработанная модель Random Forest может быть эффективно применена для прогнози

Annotation:

Antimicrobial resistance (AMR) poses a significant public health and economic challenge, increasing treatment costs and reducing antibiotic effectiveness. This study employs machine learning to analyze genomic and epidemiological data from the public databases for molecular typing and microbial genome diversity (PubMLST), incorporating data from UK government-supported AMR surveillance by the Food Standards Agency and Food Standards Scotland. We identify AMR patterns in Campylobacter jejuni and ...

ID: 2509.03551v1 q-bio.QM, cs.LG

arXiv PDF

📄 Data-driven Discovery of Digital Twins in Biomedical Research

2025-09-03

Авторы:

Clémence Métayer, Annabelle Ballesta, Julien Martinelli

#### Контекст В последние десятилетия технологии высокого производительности позволили создавать цифровые модели биомедицинских систем и пациентов. Эти цифровые двойники, или digital twins, могут описывать ключевые реакционные сети, влияющие на биологические системы, включая ответы на лекарства и возможности лечения. Однако создание этих моделей часто требует трудоемкой интеграции данных, что ограничивает их универсальность и эффективность. Для того чтобы улучшить процесс создания digital twins, требуется разработка автоматизированных методов, которые могут упростить интеллектуальную нагрузку на человека и повысить точность и надежность данных моделей. #### Метод Методология развития digital twins в биологии основывается на нескольких ключевых подходах. Символьная и спарсе регрессия — это основные методы, используемые для выявления структуры биологических систем с помощью временных рядов данных. Данные представляют собой значительные вызовы, включая шум, неполноту, необходимость интеграции предварительных знаний и обработку высокомерности. Особенно успешными оказались алгоритмы спарсе регрессии, особенно те, что используют фреймворки Байеса, так как они умело комбинируют экспериментальные данные с теоретическими моделями. Более того, внедрение глубокого обучения и языковых моделей становится все более актуальным, так как эти технологии могут улучшить интеграцию предварительных знаний и прогнозирование. Несмотря на это, ни один метод не может удовлетворять всем биологическим и методологическим вызовам одновременно. #### Результаты В ходе экспериментов были проанализированы несколько методов автоматического выявления digital twins. Использовались различные типы биологических данных, включая временные ряды, полученные с помощью высокопроизводительных технологий. Обнаружилось, что спарсе регрессия показывает лучшие результаты, особенно когда используется фреймворк Байеса. Эти методы удачно обрабатывают шум и неполноту данных, что важно для биологических исследований. Однако глубокое обучение также демонстрирует перспективу, особенно когда интегрирует значительные объемы предварительных знаний. Тем не менее, необходимо работать над улучшением надежности и последовательности таких подходов. #### Значимость Развитие digital twins в биомедицине открывает новые возможности для лечения персонализированных терапий, раннего диагностирования заболеваний и изучения биологических систем. Эти модели могут помочь в изучении фармакологической активности лекарств, а также в создании стратегий лечения, ориентированных на индивидуального пациента.

Annotation:

Recent technological advances have expanded the availability of high-throughput biological datasets, enabling the reliable design of digital twins of biomedical systems or patients. Such computational tools represent key reaction networks driving perturbation or drug response and can guide drug discovery and personalized therapeutics. Yet, their development still relies on laborious data integration by the human modeler, so that automated approaches are critically needed. The success of data-dri...

ID: 2508.21484v2 q-bio.QM, cs.LG, stat.ML

arXiv PDF

📄 Data-driven Discovery of Digital Twins in Biomedical Research

2025-09-02

Авторы:

Clémence Métayer, Annabelle Ballesta, Julien Martinelli

## Контекст ### Область исследования и мотивация Появление высокопроизводительных технологий в биомедицинских исследованиях привело к обширному доступу к широкомасштабным данным, которые обеспечили надежный дизайн цифровых двойников биомедицинских систем и пациентов. Эти цифровые двойники моделируют ключевые реакционные сети, определяющие переносимость или ответ на лекарственные препараты, и оказывают важную поддержку в лекарственном открытии и персонализированных терапиях. Однако, в настоящее время, их развитие все еще опирается на трудоемкую интеграцию данных вручную моделиром, что делает критически важной разработку автоматизированных подходов. ### Значимость Изучение автоматического выявления цифровых двойников в биомедицинских исследованиях имеет перспективу для внедрения во все более широких областях, включая разработку новых лекарств, индивидуализированной медицины и подробное понимание биологических систем. Однако, существующие технологии встречаются с рядом технических вызовов, включая шумные и неполные данные, неопределенность в моделировании и сложности в интеграции предварительных знаний. ## Метод ### Методология и технические решения Методология, рассматриваемая в работе, основывается на автоматической интерпретации цифровых двойников с помощью символического и спарсе регрессии. Символическое моделирование позволяет выражать биологические процессы через латеральные уравнения, в то время как спарсе регрессия оптимизирует веса параметров в предложенной библиотеке реакций. Эти методы адаптируются для работы с шумными и неполными данными, которые характерны для биологических исследований. ### Архитектура Архитектура методологии включает следующие компоненты: - **Интеграция данных**: Сбор и обработка биологических данных с различных источников, включая различные типы биологических сигналов и высокопроизводительные технологии. - **Обработка данных**: Методы для удаления шума, заполнения пропусков и аппроксимации производных переменных. - **Моделирование сети**: Реализация символической и спарсе регрессии для выявления цифровых двойников. - **Оценка результатов**: Измерение точности, валидности и общей универсальности моделированных сетей. ## Результаты ### Эксперименты и Данные Наборы данных включали опыты с биологическими системами, где измерялись динамические переменные при различных условиях. Это включало данные о выражении генов, протеинов, метаболических процессах и других ключевых показателях. ### Резуль

Annotation:

ID: 2508.21484v1 q-bio.QM, cs.LG, stat.ML

arXiv PDF

Показано 11 - 20 из 23 записей