Predicting Antimicrobial Resistance (AMR) in Campylobacter, a Foodborne Pathogen, and Cost Burden Analysis Using Machine Learning
2509.03551v1
q-bio.QM, cs.LG
2025-09-05
Авторы:
Shubham Mishra, The Anh Han, Bruno Silvester Lopes, Shatha Ghareeb, Zia Ush Shamszaman
Резюме на русском
## Контекст
Антимикробная резистентность (AMR) является критической проблемой для здравоохранения и экономики, приводя к усложнению лечения инфекций, увеличению затрат и сокращению эффективности антибиотиков. Особенно важной является проблема AMR в Campylobacter spp., широко распространенных пищеводных патогенах, вызывающих campylobacteriosis. Эта болезнь широко распространена в мире и является поводом для немалого количества посещений врачей и антибиотикотерапии. Традиционные методы диагностики AMR часто ограничены по времени и ресурсам. Машинное обучение предлагается как альтернативный подход для точного и быстрого определения AMR. Целью этого исследования является разработка и оценка модели машинного обучения для прогнозирования AMR в Campylobacter jejuni и Campylobacter coli, а также оценка экономических последствий AMR на здравоохранение.
## Метод
Данных для исследования по статистике Campylobacter spp. из Британии посредством геномного секвенирования в ходе временных рядов обработки были получены из PubMLST, Food Standards Agency, и Food Standards Scotland. Модель Random Forest была обучена для прогнозирования AMR, принимая во внимание показатели клинической резистентности и генетические маркеры, такие как мутации в gyrA для противостояния флуороквинолам и синтагма tet(O) для противостояния тетрациклина. Для прогнозирования временных рядов campylobacteriosis использовались SARIMA, SIR, и Prophet. Для уточнения прогнозов использовались дополнительные данные о временных рядах, погрешность и тренды резистентности.
## Результаты
Проведенные эксперименты показали, что модель Random Forest обеспечивает достаточную точность в прогнозировании AMR в Campylobacter — 74% при проверке на 1,000 бутстреп-выборках. Модели временных рядов прогнозировали повышение частоты campylobacteriosis до более чем 130 случаев на 100,000 человек к 2050 году, с прогнозируемыми затратами на лечение и производство продуктов питания, превышающими 1.9 миллиарда фунтов стерлингов в год, если не будут приняты меры. Расширенная модель Random Forest улучшила прогнозы, анализируя 6,683 изолятов, подтвердив высокую резистентность к бета-лактамам, возрастающую резистентность к флуороквинолам и переменную резистентность к тетрациклинам.
## Значимость
Результаты имеют потенциал для использования в амбулаторных и больничных условиях для точного диагностирования AMR и выбора эффективного антибиотика. Модели могут поддерживать масштабные выстраивания прогнозов AMR и снижения рисков здоровью населения. Экономические потери, связанные с AMR, могут быть существенно снижены, если будут применены рекомендации моделей.
## Выводы
Разработанная модель Random Forest может быть эффективно применена для прогнози
Abstract
Antimicrobial resistance (AMR) poses a significant public health and economic
challenge, increasing treatment costs and reducing antibiotic effectiveness.
This study employs machine learning to analyze genomic and epidemiological data
from the public databases for molecular typing and microbial genome diversity
(PubMLST), incorporating data from UK government-supported AMR surveillance by
the Food Standards Agency and Food Standards Scotland. We identify AMR patterns
in Campylobacter jejuni and Campylobacter coli isolates collected in the UK
from 2001 to 2017. The research integrates whole-genome sequencing (WGS) data,
epidemiological metadata, and economic projections to identify key resistance
determinants and forecast future resistance trends and healthcare costs. We
investigate gyrA mutations for fluoroquinolone resistance and the tet(O) gene
for tetracycline resistance, training a Random Forest model validated with
bootstrap resampling (1,000 samples, 95% confidence intervals), achieving 74%
accuracy in predicting AMR phenotypes. Time-series forecasting models (SARIMA,
SIR, and Prophet) predict a rise in campylobacteriosis cases, potentially
exceeding 130 cases per 100,000 people by 2050, with an economic burden
projected to surpass 1.9 billion GBP annually if left unchecked. An enhanced
Random Forest system, analyzing 6,683 isolates, refines predictions by
incorporating temporal patterns, uncertainty estimation, and resistance trend
modeling, indicating sustained high beta-lactam resistance, increasing
fluoroquinolone resistance, and fluctuating tetracycline resistance.
Ссылки и действия
Дополнительные ресурсы: