📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Ajit Kumar, IndraPrakash Jha

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Protein language models (PLMs) have transformed sequence-based protein analysis, yet most applications rely only on final-layer embeddings, which may overlook biologically meaningful information encoded in earlier layers. We systematically evaluate all 33 layers of ESM-2 for kinase functional prediction using both unsupervised clustering and supervised classification. We show that mid-to-late transformer layers (layers 20-33) outperform the final layer by 32 percent in unsupervised Adjusted Rand...
ID: 2512.00376v1 q-bio.QM, cs.AI, cs.LG
Авторы:

Pratik Chakraborty, Aryan Bhargava

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Proteins perform essential biological functions, and accurate classification of their sequences is critical for understanding structure-function relationships, enzyme mechanisms, and molecular interactions. This study presents a deep learning-based framework for functional group classification of protein sequences derived from the Protein Data Bank (PDB). Four architectures were implemented: Convolutional Neural Network (CNN), Bidirectional Long Short-Term Memory (BiLSTM), CNN-BiLSTM hybrid, and...
ID: 2511.13791v1 q-bio.QM, cs.AI, cs.LG
Авторы:

Zhaoxuan Wang, Weichen Kang, Yutian Han, Lingyuan Zhao, Bo Li

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Human Immunodeficiency Virus (HIV) has posed a major global health challenge for decades, and forecasting HIV diagnoses continues to be a critical area of research. However, capturing the complex spatial and temporal dependencies of HIV transmission remains challenging. Conventional Message Passing Neural Network (MPNN) models rely on a fixed binary adjacency matrix that only encodes geographic adjacency, which is unable to represent interactions between non-contiguous counties. Our study propos...
ID: 2511.13797v1 q-bio.QM, cs.AI, cs.LG
Авторы:

Abraham Francisco Arellano Tavara, Umesh Kumar, Jathurshan Pradeepkumar, Jimeng Sun

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Variants of Uncertain Significance (VUS) limit the clinical utility of prostate cancer genomics by delaying diagnosis and therapy when evidence for pathogenicity or benignity is incomplete. Progress is further limited by inconsistent annotations across sources and the absence of a prostate-specific benchmark for fair comparison. We introduce Prostate-VarBench, a curated pipeline for creating prostate-specific benchmarks that integrates COSMIC (somatic cancer mutations), ClinVar (expert-curated c...
ID: 2511.09576v1 q-bio.QM, cs.AI, cs.LG
Авторы:

Alif Elham Khan

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Medical image labels are often organized by taxonomies (e.g., organ - tissue - subtype), yet standard self-supervised learning (SSL) ignores this structure. We present a hierarchy-preserving contrastive framework that makes the label tree a first-class training signal and an evaluation target. Our approach introduces two plug-in objectives: Hierarchy-Weighted Contrastive (HWC), which scales positive/negative pair strengths by shared ancestors to promote within-parent coherence, and Level-Aware M...
ID: 2511.03771v1 q-bio.QM, cs.AI, cs.LG
Авторы:

Elias Hossain, Mehrdad Shoeibi, Ivan Garibay, Niloofar Yousefi

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We propose CITE V.1, an agentic, evidence-grounded framework that leverages Large Language Models (LLMs) to provide transparent and reproducible interpretations of RNA-seq clusters. Unlike existing enrichment-based approaches that reduce results to broad statistical associations and LLM-only models that risk unsupported claims or fabricated citations, CITE V.1 transforms cluster interpretation by producing biologically coherent explanations explicitly anchored in the biomedical literature. The f...
ID: 2510.16082v1 q-bio.QM, cs.AI, cs.LG
Авторы:

Niranjana Arun Menon, Yulong Li, Iqra Farooq, Sara Ahmed, Muhammad Awais, Imran Razzak

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Cardiovascular disease (CVD) risk stratification remains a major challenge due to its multifactorial nature and limited availability of high-quality labeled datasets. While genomic and electrophysiological data such as SNP variants and ECG phenotypes are increasingly accessible, effectively integrating these modalities in low-label settings is non-trivial. This challenge arises from the scarcity of well-annotated multimodal datasets and the high dimensionality of biological signals, which limit ...
ID: 2510.16536v1 q-bio.QM, cs.AI, cs.LG
Авторы:

Zhiyu Wang, Bingxin Zhou, Jing Wang, Yang Tan, Weishu Zhao, Pietro Liò, Liang Hong

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Proteins are essential biological macromolecules that execute life functions. Local motifs within protein structures, such as active sites, are the most critical components for linking structure to function and are key to understanding protein evolution and enabling protein engineering. Existing computational methods struggle to identify and compare these local structures, which leaves a significant gap in understanding protein structures and harnessing their functions. This study presents PLASM...
ID: 2510.11752v1 q-bio.QM, cs.AI, cs.LG
Авторы:

Florensia Widjaja, Zhangtianyi Chen, Juexiao Zhou

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Bioinformatics tools are essential for complex computational biology tasks, yet their integration with emerging AI-agent frameworks is hindered by incompatible interfaces, heterogeneous input-output formats, and inconsistent parameter conventions. The Model Context Protocol (MCP) provides a standardized framework for tool-AI communication, but manually converting hundreds of existing and rapidly growing specialized bioinformatics tools into MCP-compliant servers is labor-intensive and unsustaina...
ID: 2510.02139v1 q-bio.QM, cs.AI, cs.LG, cs.MA
Авторы:

Nimisha Ghosh, Dheeran Sankaran, Rahul Balakrishnan Adhi, Sharath S, Amrut Anand

#### Контекст Определение DNA- и RNA-binding proteins (DBPs и RBPs) является важной задачей в геномических и биоинформатических исследованиях. Эти белок-биндинги могут взаимодействовать с ДНК или РНК, определяя ключевые процессы генетического регулирования. Однако существующие подходы сталкиваются с проблемами выявления различий между DBPs и RBPs, что приводит к высокой скорости ошибочных прогнозов. Более сложная задача заключается в идентификации DRBPs — белков, которые способны взаимодействовать с обеими липидами. Чтобы улучшить точность и конкретность таких определений, предлагается новый подход LAMP-PRo, который воспользуется предобученными моделями языка белков и механизмами акцентации. #### Метод LAMP-PRo основывается на модели ESM-2 (protein language model), которая генерирует последовательности белков для последующего обработки. Для улучшения контекстуального понимания применяется CNN и многоголосная самопроизвольная аттенция, чтобы получить класс-специфические представления для DBP, RBP и DRBP. Для более точной идентификации DRBP введена кросс-аттенция, позволяющая перекрестно анализировать взаимосвязи между DBP и RBP. На выходе LAMP-PRo использует линейный слой и функцию сигмоиды для получения предсказаний. Этот подход позволяет не только улучшить предсказания, но и обеспечить представительность модели. #### Результаты Исследования проводились с использованием датасетов, доступных по адресу http://bliulab.net/iDRBP\_MMC. Модель LAMP-PRo показала высокую точность и избежала высокой скорости ошибок в дифференциации DBP и RBP. Измерения показали, что LAMP-PRo превосходит существующие методы, а визуализации результатов демонстрируют, какие части последовательности белка имеют самую высокую зависимость от каждого из классов. #### Значимость LAMP-PRo может применяться в различных биологических и генетических исследованиях для идентификации белков, взаимодействующих с ДНК и РНК. Его преимущества заключаются в точности, уменьшении ошибки кросс-предикции и повышении интерпретируемости решений. Это модель может способствовать развитию технологий в области биоинформатики и генетического регулирования, предоставляя стабильные и интерпретируемые прогнозы. #### Выводы LAMP-PRo является новым подходом к определению DBP, RBP и DRBP, который успешно решает проблему высокой сложности различения между этими классами. Будущие исследования будут сфокусированы на улучшении модели и ее применении в реальных биологических задачах, включая предоставление предсказаний для древовидных структур белков и их взаимодействий с ДНК и Р
Annotation:
Identifying DNA- (DBPs) and RNA-binding proteins (RBPs) is crucial for the understanding of cell function, molecular interactions as well as regulatory functions. Owing to their high similarity, most of the existing approaches face challenges in differentiating between DBPs and RBPs leading to high cross-prediction errors. Moreover, identifying proteins which bind to both DNA and RNA (DRBPs) is also quite a challenging task. In this regard, we propose a novel framework viz. LAMP-PRo which is bas...
ID: 2509.24262v1 q-bio.QM, cs.AI, cs.LG
Показано 1 - 10 из 14 записей