📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
Авторы:
Ajit Kumar, IndraPrakash Jha
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Protein language models (PLMs) have transformed sequence-based protein analysis, yet most applications rely only on final-layer embeddings, which may overlook biologically meaningful information encoded in earlier layers. We systematically evaluate all 33 layers of ESM-2 for kinase functional prediction using both unsupervised clustering and supervised classification. We show that mid-to-late transformer layers (layers 20-33) outperform the final layer by 32 percent in unsupervised Adjusted Rand...
Авторы:
Pratik Chakraborty, Aryan Bhargava
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Proteins perform essential biological functions, and accurate classification of their sequences is critical for understanding structure-function relationships, enzyme mechanisms, and molecular interactions. This study presents a deep learning-based framework for functional group classification of protein sequences derived from the Protein Data Bank (PDB). Four architectures were implemented: Convolutional Neural Network (CNN), Bidirectional Long Short-Term Memory (BiLSTM), CNN-BiLSTM hybrid, and...
Авторы:
Zhaoxuan Wang, Weichen Kang, Yutian Han, Lingyuan Zhao, Bo Li
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Human Immunodeficiency Virus (HIV) has posed a major global health challenge for decades, and forecasting HIV diagnoses continues to be a critical area of research. However, capturing the complex spatial and temporal dependencies of HIV transmission remains challenging. Conventional Message Passing Neural Network (MPNN) models rely on a fixed binary adjacency matrix that only encodes geographic adjacency, which is unable to represent interactions between non-contiguous counties. Our study propos...
Авторы:
Abraham Francisco Arellano Tavara, Umesh Kumar, Jathurshan Pradeepkumar, Jimeng Sun
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Variants of Uncertain Significance (VUS) limit the clinical utility of prostate cancer genomics by delaying diagnosis and therapy when evidence for pathogenicity or benignity is incomplete. Progress is further limited by inconsistent annotations across sources and the absence of a prostate-specific benchmark for fair comparison. We introduce Prostate-VarBench, a curated pipeline for creating prostate-specific benchmarks that integrates COSMIC (somatic cancer mutations), ClinVar (expert-curated c...
Авторы:
Alif Elham Khan
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Medical image labels are often organized by taxonomies (e.g., organ - tissue
- subtype), yet standard self-supervised learning (SSL) ignores this structure.
We present a hierarchy-preserving contrastive framework that makes the label
tree a first-class training signal and an evaluation target. Our approach
introduces two plug-in objectives: Hierarchy-Weighted Contrastive (HWC), which
scales positive/negative pair strengths by shared ancestors to promote
within-parent coherence, and Level-Aware M...
Авторы:
Elias Hossain, Mehrdad Shoeibi, Ivan Garibay, Niloofar Yousefi
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We propose CITE V.1, an agentic, evidence-grounded framework that leverages
Large Language Models (LLMs) to provide transparent and reproducible
interpretations of RNA-seq clusters. Unlike existing enrichment-based
approaches that reduce results to broad statistical associations and LLM-only
models that risk unsupported claims or fabricated citations, CITE V.1
transforms cluster interpretation by producing biologically coherent
explanations explicitly anchored in the biomedical literature. The f...
Авторы:
Niranjana Arun Menon, Yulong Li, Iqra Farooq, Sara Ahmed, Muhammad Awais, Imran Razzak
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Cardiovascular disease (CVD) risk stratification remains a major challenge
due to its multifactorial nature and limited availability of high-quality
labeled datasets. While genomic and electrophysiological data such as SNP
variants and ECG phenotypes are increasingly accessible, effectively
integrating these modalities in low-label settings is non-trivial. This
challenge arises from the scarcity of well-annotated multimodal datasets and
the high dimensionality of biological signals, which limit ...
Авторы:
Zhiyu Wang, Bingxin Zhou, Jing Wang, Yang Tan, Weishu Zhao, Pietro Liò, Liang Hong
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Proteins are essential biological macromolecules that execute life functions.
Local motifs within protein structures, such as active sites, are the most
critical components for linking structure to function and are key to
understanding protein evolution and enabling protein engineering. Existing
computational methods struggle to identify and compare these local structures,
which leaves a significant gap in understanding protein structures and
harnessing their functions. This study presents PLASM...
Авторы:
Florensia Widjaja, Zhangtianyi Chen, Juexiao Zhou
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Bioinformatics tools are essential for complex computational biology tasks,
yet their integration with emerging AI-agent frameworks is hindered by
incompatible interfaces, heterogeneous input-output formats, and inconsistent
parameter conventions. The Model Context Protocol (MCP) provides a standardized
framework for tool-AI communication, but manually converting hundreds of
existing and rapidly growing specialized bioinformatics tools into
MCP-compliant servers is labor-intensive and unsustaina...
Авторы:
Nimisha Ghosh, Dheeran Sankaran, Rahul Balakrishnan Adhi, Sharath S, Amrut Anand
#### Контекст
Определение DNA- и RNA-binding proteins (DBPs и RBPs) является важной задачей в геномических и биоинформатических исследованиях. Эти белок-биндинги могут взаимодействовать с ДНК или РНК, определяя ключевые процессы генетического регулирования. Однако существующие подходы сталкиваются с проблемами выявления различий между DBPs и RBPs, что приводит к высокой скорости ошибочных прогнозов. Более сложная задача заключается в идентификации DRBPs — белков, которые способны взаимодействовать с обеими липидами. Чтобы улучшить точность и конкретность таких определений, предлагается новый подход LAMP-PRo, который воспользуется предобученными моделями языка белков и механизмами акцентации.
#### Метод
LAMP-PRo основывается на модели ESM-2 (protein language model), которая генерирует последовательности белков для последующего обработки. Для улучшения контекстуального понимания применяется CNN и многоголосная самопроизвольная аттенция, чтобы получить класс-специфические представления для DBP, RBP и DRBP. Для более точной идентификации DRBP введена кросс-аттенция, позволяющая перекрестно анализировать взаимосвязи между DBP и RBP. На выходе LAMP-PRo использует линейный слой и функцию сигмоиды для получения предсказаний. Этот подход позволяет не только улучшить предсказания, но и обеспечить представительность модели.
#### Результаты
Исследования проводились с использованием датасетов, доступных по адресу http://bliulab.net/iDRBP\_MMC. Модель LAMP-PRo показала высокую точность и избежала высокой скорости ошибок в дифференциации DBP и RBP. Измерения показали, что LAMP-PRo превосходит существующие методы, а визуализации результатов демонстрируют, какие части последовательности белка имеют самую высокую зависимость от каждого из классов.
#### Значимость
LAMP-PRo может применяться в различных биологических и генетических исследованиях для идентификации белков, взаимодействующих с ДНК и РНК. Его преимущества заключаются в точности, уменьшении ошибки кросс-предикции и повышении интерпретируемости решений. Это модель может способствовать развитию технологий в области биоинформатики и генетического регулирования, предоставляя стабильные и интерпретируемые прогнозы.
#### Выводы
LAMP-PRo является новым подходом к определению DBP, RBP и DRBP, который успешно решает проблему высокой сложности различения между этими классами. Будущие исследования будут сфокусированы на улучшении модели и ее применении в реальных биологических задачах, включая предоставление предсказаний для древовидных структур белков и их взаимодействий с ДНК и Р
Annotation:
Identifying DNA- (DBPs) and RNA-binding proteins (RBPs) is crucial for the
understanding of cell function, molecular interactions as well as regulatory
functions. Owing to their high similarity, most of the existing approaches face
challenges in differentiating between DBPs and RBPs leading to high
cross-prediction errors. Moreover, identifying proteins which bind to both DNA
and RNA (DRBPs) is also quite a challenging task. In this regard, we propose a
novel framework viz. LAMP-PRo which is bas...
Показано 1 -
10
из 14 записей