Collapsing ROC approach for risk prediction research on both common and rare variants
2508.13552v1
cs.LG, cs.AI, stat.ME
2025-08-21
Авторы:
Changshuai Wei, Qing Lu
Резюме на русском
#### Контекст
Risk prediction, основанный на генетических данных, представляет большой потенциал для улучшения общественного здравоохранения и клинического обслуживания. Однако, существующие технологии, основывающиеся на исследованиях генов, показали недостаточную точность для клинического применения. Большинство генов, включая редкие, до сих пор не были включены в геномные исследования, что затрудняет получение информации о них. Таким образом, необходимо развитие методик, включающих как обычные, так и редкие варианты. Разработан новый подход Collapsing ROC (CROC), который расширяет предыдущий Forward ROC (FROC), и может быть применен для оценки риска на основе обеих категорий вариантов.
#### Метод
Методом CROC были проанализированы 533 сингленюклеотидных полиморфизмов (SNP) из 37 генов, взятых из мини-экзома данных Genetic Analysis Workshop 17. Для сравнения результатов был проведен аналогичный анализ с использованием FROC. Оба метода были протестированы на разных уровнях точности и поддерживали различные количества вариантов. CROC включает дополнительные шаги для обработки редких вариантов, что позволяет повысить точность оценки риска.
#### Результаты
Используя CROC, была получена AUC (Area Under Curve) равная 0.605 при использовании всех вариантов. Это значение выше, чем при использовании только обычных вариантов (AUC = 0.585). При постепенном уменьшении числа обычных вариантов CROC показал лучшую точность по сравнению с FROC. В крайнем случае, когда в анализ включались только редкие варианты, CROC показал AUC = 0.603, в то время как FROC дал AUC = 0.524. Это показывает, что CROC более эффективен при работе со смешанными данными.
#### Значимость
Разработанный подход CROC может быть применен в различных областях медицины, где необходимо оценивать риск заболеваний на основе генетических факторов. Он демонстрирует преимущества по сравнению с FROC, особенно при оценке риска на основе редких вариантов. Это может привести к более точным прогнозам и улучшению клинических решений.
#### Выводы
Результаты показывают, что CROC может значительно улучшить точность оценки риска, включая обработку редких вариантов. Будущие исследования должны фокусироваться на расширении применения CROC на большие комплексы данных и развитии его в широкой клинической практике.
Abstract
Risk prediction that capitalizes on emerging genetic findings holds great
promise for improving public health and clinical care. However, recent risk
prediction research has shown that predictive tests formed on existing common
genetic loci, including those from genome-wide association studies, have lacked
sufficient accuracy for clinical use. Because most rare variants on the genome
have not yet been studied for their role in risk prediction, future disease
prediction discoveries should shift toward a more comprehensive risk prediction
strategy that takes into account both common and rare variants. We are
proposing a collapsing receiver operating characteristic CROC approach for risk
prediction research on both common and rare variants. The new approach is an
extension of a previously developed forward ROC FROC approach, with additional
procedures for handling rare variants. The approach was evaluated through the
use of 533 single-nucleotide polymorphisms SNPs in 37 candidate genes from the
Genetic Analysis Workshop 17 mini-exome data set. We found that a prediction
model built on all SNPs gained more accuracy AUC = 0.605 than one built on
common variants alone AUC = 0.585. We further evaluated the performance of two
approaches by gradually reducing the number of common variants in the analysis.
We found that the CROC method attained more accuracy than the FROC method when
the number of common variants in the data decreased. In an extreme scenario,
when there are only rare variants in the data, the CROC reached an AUC value of
0.603, whereas the FROC had an AUC value of 0.524.
Ссылки и действия
Дополнительные ресурсы: