📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня

📄 On the Approximation of Phylogenetic Distance Functions by Artificial Neural Networks

2025-12-04

Авторы:

Benjamin K. Rosenzweig, Matthew W. Hahn

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Inferring the phylogenetic relationships among a sample of organisms is a fundamental problem in modern biology. While distance-based hierarchical clustering algorithms achieved early success on this task, these have been supplanted by Bayesian and maximum likelihood search procedures based on complex models of molecular evolution. In this work we describe minimal neural network architectures that can approximate classic phylogenetic distance functions and the properties required to learn distan...

ID: 2512.02223v1 cs.LG, q-bio.PE

arXiv PDF

📄 Near-Lossless Model Compression Enables Longer Context Inference in DNA Large Language Models

2025-11-20

Авторы:

Rui Zhu, Xiaopu Zhou, Haixu Tang, Stephen W. Scherer, Lucila Ohno-Machado

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Trained on massive cross-species DNA corpora, DNA large language models (LLMs) learn the fundamental "grammar" and evolutionary patterns of genomic sequences. This makes them powerful priors for DNA sequence modeling, particularly over long ranges. However, two major constraints hinder their use in practice: the quadratic computational cost of self-attention and the growing memory required for key-value (KV) caches during autoregressive decoding. These constraints force the use of heuristics suc...

ID: 2511.14694v1 q-bio.GN, cs.AI, cs.LG, q-bio.PE

arXiv PDF

📄 BATIS: Bayesian Approaches for Targeted Improvement of Species Distribution Models

2025-10-24

Авторы:

Catherine Villeneuve, Benjamin Akera, Mélisande Teng, David Rolnick

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Species distribution models (SDMs), which aim to predict species occurrence based on environmental variables, are widely used to monitor and respond to biodiversity change. Recent deep learning advances for SDMs have been shown to perform well on complex and heterogeneous datasets, but their effectiveness remains limited by spatial biases in the data. In this paper, we revisit deep SDMs from a Bayesian perspective and introduce BATIS, a novel and practical framework wherein prior predictions are...

ID: 2510.19749v1 cs.LG, q-bio.PE, q-bio.QM

arXiv PDF

📄 MAESTRO: Multi-modal Adaptive Estimation for Temporal Respiratory Disease Outbreak

2025-09-15

Авторы:

Hong Liu, Kerui Cen, Yanxing Chen, Zige Liu, Dong Chen, Zifeng Yang, Chitin Hon

## Контекст Временной ряд прогнозирования заболеваемости лечащими инфекционными заболеваниями является важной задачей для принятия решений в области здравоохранения. Одной из приоритетных задач является прогнозирование заболеваемости инфлиуензем, которая позволяет принять временные меры по уменьшению риска широкого распространения инфекций. Несмотря на развитие методов прогнозирования, существуют значительные проблемы, связанные с неточностью прогнозов и неэффективностью интеграции разных источников данных. Это приводит к ограниченной точности прогнозов и недостаточной адаптации к изменениям в данных. Мотивирует это развитие методов, которые могут лучше интегрировать различные типы данных и адаптироваться к изменениям в здоровьестоящей ситуации. ## Метод MAESTRO (Multi-modal Adaptive Estimation for Temporal Respiratory Disease Outbreak) представляет собой инновационный фреймворк, который объединяет современные подходы в моделировании временных рядов и многомодальную интеграцию данных. Он использует спектро-временную моделирование для анализа временных рядов, а также многомодальную интеграцию данных, включая анализ поисковых запросов, погодные данные и данные обозревателей заболеваемости. Модель адаптивно взвешивает различные источники данных, что позволяет уменьшить влияние их неточностей. Она также разделяет временные ряды на более простые составляющие, чтобы повысить точность прогноза. Эта методология обеспечивает гибкость и точность в прогнозировании временной заболеваемости. ## Результаты На основе многолетних данных об инфекционных заболеваниях в Гонконге (исключая период COVID-19), MAESTRO продемонстрировал выдающиеся результаты. Модель достигла R-square значения 0.956, что является высоким показателем для прогнозирования заболеваемости. Анализы абляций показали, что оба основных компонента модели — многомодальность и спектро-временное моделирование — значительно влияют на ее успех. Эти результаты подтверждают высокую точность и универсальность метода в прогнозировании заболеваемости респираторными заболеваниями. ## Значимость Приложение MAESTRO может быть применено в различных областях здравоохранения для прогнозирования заболеваемости различными инфекционными заболеваниями. Он предлагает значительные преимущества, включая увеличение точности прогнозов, уменьшение влияния шума в данных и универсальность для разных регионов и патогенов. Эта модель может стать сильным инструментом для государственных органов и помочь в разработке прогнозов и временных мер для борьбы с заболеваниями. ## Выводы Результаты исследования показали, что MAESTRO является эффективным инструментом для прогнозирования заболеваемости респирато

Annotation:

Timely and robust influenza incidence forecasting is critical for public health decision-making. This paper presents MAESTRO (Multi-modal Adaptive Estimation for Temporal Respiratory Disease Outbreak), a novel, unified framework that synergistically integrates advanced spectro-temporal modeling with multi-modal data fusion, including surveillance, web search trends, and meteorological data. By adaptively weighting heterogeneous data sources and decomposing complex time series patterns, the model...

ID: 2509.08578v2 cs.LG, q-bio.PE, q-bio.QM

arXiv PDF

📄 Fused Lasso Improves Accuracy of Co-occurrence Network Inference in Grouped Samples

2025-09-13

Авторы:

Daniel Agyapong, Briana H. Beatty, Peter G. Kennedy, Toby D. Hocking

## Контекст Координационные сети микробной коммуникации (Co-occurrence network inference) позволили значительно расширить понимание структуры и функционирования микробных сообществ. Однако, эти алгоритмы, как правило, ограничиваются анализом статических снимков микробной коммуникации в одной экологической нише. Они не учитывают, как микробные сообщества меняют свои связи при взаимодействии с различными экологическими условиями. Наша исследовательская работа направлена на исследование динамических процессов в микробных сообществах, принимая во внимание особенности их адаптации к разным условиям. Мы работали с публично доступными данными микробного состава в разных местах и временных моментах. Эти данные позволили нам оценить эффективность различных методик в предсказании микробных связей. Наша цель — сделать алгоритмы более точными и универсальными, учитывая эти динамические аспекты. ## Метод Мы разработали процедуру Same-All Cross-validation (SAC), которая позволяет оценивать алгоритмы в двух отдельных сценариях. В первом сценарии (Same), алгоритм обучается и тестируется в рамках одной экологической ниши. Во втором (All), алгоритм обучается на данных из нескольких экологических ниш и тестируется на комбинированных данных. Мы предложили новый алгоритм, который мы назвали fuser. Он не является совершенно новым в машинном обучении, но новым в контексте интерпретации микробных сообществ. Fuser сохраняет специфические для подвыборки сигналы, при этом делится связанной информацией между разными экологическими условиями в ходе обучения. В отличие от стандартных подходов, которые пытаются построить общую сеть для всех данных, fuser порождает сети, привязанные к конкретным экологическим условиям. Это позволяет улучшить точность и динамичность предсказаний. ## Результаты Мы провели эксперименты, используя различные наборы данных с микробного состава, собранных в разных экологических условиях. Функционал SAC позволил нам оценивать производительность алгоритмов в разных сценариях. Мы сравнили наш алгоритм fuser с другими методами, такими как glmnet. Результаты показали, что fuser демонстрирует аналогичную точность в сценарии Same, где обучение и тестирование происходят в одной экологической нищи. Однако в сценарии All, где обучение производится на нескольких экологических ниш, fuser существенно уменьшает ошибки в прогнозировании, улучшая результаты по сравнению с другими алгоритмами. ## Значимость Наша работа может быть применена в различных областях, где требуется точное предсказание микробных связей, например, в работе с микробными терапиями или в агробио

Annotation:

Co-occurrence network inference algorithms have significantly advanced our understanding of microbiome communities. However, these algorithms typically analyze microbial associations within samples collected from a single environmental niche, often capturing only static snapshots rather than dynamic microbial processes. Previous studies have commonly grouped samples from different environmental niches together without fully considering how microbial communities adapt their associations when face...

ID: 2509.09413v1 cs.LG, q-bio.PE

arXiv PDF

📄 MAESTRO: Multi-modal Adaptive Ensemble for Spectro-Temporal Robust Optimization

2025-09-12

Авторы:

Hong Liu

#### Контекст Прогнозирование инцидентов инфлюенции является ключевым аспектом принятия решений в области общественного здравоохранения. Однако традиционные модели часто сталкиваются с проблемами нестабильности и низкой точностью в условиях неоднородности данных и непредсказуемых внешних факторов. Данная работа нацелена на разработку модели, объединяющей многомодальные данные и высокую степень устойчивости к шумам, для создания более точных и надежных прогнозов. #### Метод Модель **MAESTRO** (Multi-modal Adaptive Ensemble for Spectro-Temporal Robust Optimization) представляет собой сложное адаптивное а Eнсембление, объединяющее несколько модальностей данных, включая зоопастные сигналы, поисковые запросы в интернете и метеорологические данные. Работа метода основывается на декомпозиции временных рядов на составляющие — сезонные и трендовые. Далее, данные обрабатываются с использованием гибридного моделирования функций, включающего трансформер-базированные энкодеры, модель состояний Мамба для учета длинных зависимостей, многомерные темпоральные конволюции и анализ в частотном домене. Механизм кросс-канального внимания объединяет входные данные из разных модальностей. Наконец, модель выполняет прогнозирование с помощью подхода сиквела-сиквел, с возможностью оценки неопределенности прогноза. #### Результаты На выборке данных по инцидентам инфлюенции в Гонконге за 11-летний период (исключая период COVID-19), MAESTRO достиг среднего R-квадрат 0.956, что является состоянием лидерства в сравнении с другими моделями. Эксперименты показали, что модель показывает высокую устойчивость к шуму и неоднородности данных, а также эффективно интегрирует многомодальные источники. Аблэйтонные эксперименты подтвердили вклад как многомодального подхода, так и компонентов спектро-временной обработки. #### Значимость MAESTRO представляет собой мощный инструмент для прогнозирования инцидентов медицинских заболеваний. Его можно применить для различных регионов и заболеваний, предоставив платформу для более точного и надежного здоровьесохранения. Его ключевым преимуществом является возможность разделения сезонных и трендовых компонентов, что позволяет обеспечить точные прогнозы даже при изменении характера внешних факторов. #### Выводы Результаты подтверждают высокую эффективность MAESTRO в прогнозировании инцидентов инфлюенции. На основе этого работы могут быть разработаны дальнейшие исследования, направленные на расширение модели для других регионов и типов заболеваний, а также для улучшения ее надёжности в условиях пандемий и крупных сдвигов внешних факторов.

Annotation:

Timely and robust influenza incidence forecasting is critical for public health decision-making. To address this, we present MAESTRO, a Multi-modal Adaptive Ensemble for Spectro-Temporal Robust Optimization. MAESTRO achieves robustness by adaptively fusing multi-modal inputs-including surveillance, web search trends, and meteorological data-and leveraging a comprehensive spectro-temporal architecture. The model first decomposes time series into seasonal and trend components. These are then proce...

ID: 2509.08578v1 cs.LG, q-bio.PE, q-bio.QM

arXiv PDF