MAGIC: Multi-task Gaussian process for joint imputation and classification in healthcare time series

2509.19577v1 stat.ML, cs.LG 2025-09-26
Авторы:

Dohyun Ku, Catherine D. Chong, Visar Berisha, Todd J. Schwedt, Jing Li

Резюме на русском

## Контекст Исследования в области анализа значков временных рядов в здравоохранении целевая область, направленная на точные диагностические и прогностические выводы. Одним из ключевых проблем, с которыми сталкиваются аналитики, является "метки времени" (time misalignment) и "нехватка данных" (data sparsity). Эти проблемы становятся проблемами, когда данные отсутствуют или непоследовательны во времени. Традиционные подходы обычно разделяют проблему на два этапа: импутация и прогноз. Однако это приводит к увеличению времени обработки и потерям информации. Мы предлагаем новый подход, который удачно объединяет оба этапа в одном фреймворке, чтобы увеличить точность и эффективность. ## Метод Мы предлагаем MAGIC (Multi-tAsk Gaussian Process for Imputation and Classification), новый фреймворк, который решает две задачи одновременно: импутацию пропущенных данных и классификацию. Этот подход основан на многозадачном гауссовском процессе, который может учитывать информацию о классе и выполнять классификацию внутри этого процесса. Основными инновациями являются: 1) трансформация задачи импутации в классификационную задачу с использованием логистической регрессии, 2) использование гауссовского процесса для решения проблемы малого размера выборки, 3) использование теории приближений Тейлора для решения задачи неинтрактуабельности функционального логарифмического правдоподобия. ## Результаты Мы проверили эффективность MAGIC на двух симулированных задачах: 1) прогноз пост-травматической головной боли после травмы мозга, 2) прогноз смерти в течение 48 часов после приема в ИКБ. Наши результаты показывают, что MAGIC превосходит существующие методы по метрикам точности и эффективности. В обоих случаях MAGIC удалось достичь более точных прогнозов даже при небольших объёмах данных, что демонстрирует его практическую применимость в реальном времени. ## Значимость MAGIC показал свою значимость в области здравоохранения, где необходимо выполнять точные диагностические задачи в условиях необходимости быстрого решения. Этот подход может быть использован для многих задач, таких как прогноз прогресса заболевания, оценка риска, оптимизация ресурсов в здравоохранении. Особым преимуществом MAGIC является его универсальность и точность даже при недостатке данных, что сделает его важной инструментой для клинического применения. ## Выводы MAGIC представляет собой перспективный подход к решению проблем импутации и классификации временных рядов в здравоохранении. Мы нашли, что он превосходит существующие методы в тех же условиях. Будущие исследования будут на

Abstract

Time series analysis has emerged as an important tool for improving patient diagnosis and management in healthcare applications. However, these applications commonly face two critical challenges: time misalignment and data sparsity. Traditional approaches address these issues through a two-step process of imputation followed by prediction. We propose MAGIC (Multi-tAsk Gaussian Process for Imputation and Classification), a novel unified framework that simultaneously performs class-informed missing value imputation and label prediction within a hierarchical multi-task Gaussian process coupled with functional logistic regression. To handle intractable likelihood components, MAGIC employs Taylor expansion approximations with bounded error analysis, and parameter estimation is performed using EM algorithm with block coordinate optimization supported by convergence analysis. We validate MAGIC through two healthcare applications: prediction of post-traumatic headache improvement following mild traumatic brain injury and prediction of in-hospital mortality within 48 hours after ICU admission. In both applications, MAGIC achieves superior predictive accuracy compared to existing methods. The ability to generate real-time and accurate predictions with limited samples facilitates early clinical assessment and treatment planning, enabling healthcare providers to make more informed treatment decisions.

Ссылки и действия