MAGIC: Multi-task Gaussian process for joint imputation and classification in healthcare time series
2509.19577v1
stat.ML, cs.LG
2025-09-26
Авторы:
Dohyun Ku, Catherine D. Chong, Visar Berisha, Todd J. Schwedt, Jing Li
Резюме на русском
## Контекст
Исследования в области анализа значков временных рядов в здравоохранении целевая область, направленная на точные диагностические и прогностические выводы. Одним из ключевых проблем, с которыми сталкиваются аналитики, является "метки времени" (time misalignment) и "нехватка данных" (data sparsity). Эти проблемы становятся проблемами, когда данные отсутствуют или непоследовательны во времени. Традиционные подходы обычно разделяют проблему на два этапа: импутация и прогноз. Однако это приводит к увеличению времени обработки и потерям информации. Мы предлагаем новый подход, который удачно объединяет оба этапа в одном фреймворке, чтобы увеличить точность и эффективность.
## Метод
Мы предлагаем MAGIC (Multi-tAsk Gaussian Process for Imputation and Classification), новый фреймворк, который решает две задачи одновременно: импутацию пропущенных данных и классификацию. Этот подход основан на многозадачном гауссовском процессе, который может учитывать информацию о классе и выполнять классификацию внутри этого процесса. Основными инновациями являются: 1) трансформация задачи импутации в классификационную задачу с использованием логистической регрессии, 2) использование гауссовского процесса для решения проблемы малого размера выборки, 3) использование теории приближений Тейлора для решения задачи неинтрактуабельности функционального логарифмического правдоподобия.
## Результаты
Мы проверили эффективность MAGIC на двух симулированных задачах: 1) прогноз пост-травматической головной боли после травмы мозга, 2) прогноз смерти в течение 48 часов после приема в ИКБ. Наши результаты показывают, что MAGIC превосходит существующие методы по метрикам точности и эффективности. В обоих случаях MAGIC удалось достичь более точных прогнозов даже при небольших объёмах данных, что демонстрирует его практическую применимость в реальном времени.
## Значимость
MAGIC показал свою значимость в области здравоохранения, где необходимо выполнять точные диагностические задачи в условиях необходимости быстрого решения. Этот подход может быть использован для многих задач, таких как прогноз прогресса заболевания, оценка риска, оптимизация ресурсов в здравоохранении. Особым преимуществом MAGIC является его универсальность и точность даже при недостатке данных, что сделает его важной инструментой для клинического применения.
## Выводы
MAGIC представляет собой перспективный подход к решению проблем импутации и классификации временных рядов в здравоохранении. Мы нашли, что он превосходит существующие методы в тех же условиях. Будущие исследования будут на
Abstract
Time series analysis has emerged as an important tool for improving patient
diagnosis and management in healthcare applications. However, these
applications commonly face two critical challenges: time misalignment and data
sparsity. Traditional approaches address these issues through a two-step
process of imputation followed by prediction. We propose MAGIC (Multi-tAsk
Gaussian Process for Imputation and Classification), a novel unified framework
that simultaneously performs class-informed missing value imputation and label
prediction within a hierarchical multi-task Gaussian process coupled with
functional logistic regression. To handle intractable likelihood components,
MAGIC employs Taylor expansion approximations with bounded error analysis, and
parameter estimation is performed using EM algorithm with block coordinate
optimization supported by convergence analysis. We validate MAGIC through two
healthcare applications: prediction of post-traumatic headache improvement
following mild traumatic brain injury and prediction of in-hospital mortality
within 48 hours after ICU admission. In both applications, MAGIC achieves
superior predictive accuracy compared to existing methods. The ability to
generate real-time and accurate predictions with limited samples facilitates
early clinical assessment and treatment planning, enabling healthcare providers
to make more informed treatment decisions.
Ссылки и действия
Дополнительные ресурсы: