Causal Representation Learning from Multimodal Clinical Records under Non-Random Modality Missingness

2509.17228v1 cs.LG, cs.CL, stat.ME 2025-09-24
Авторы:

Zihan Liang, Ziwen Pan, Ruoxuan Xiong

Резюме на русском

## Контекст Клинические заметки содержат богатый набор информации о пациентах, включая диагнозы, медикаментозное лечение и другие ключевые данные. Эти данные являются ценными для создания точных представлений о состоянии пациента. Несмотря на то, что новейшие модели языка позволяют эффективно извлекать смысловую информацию из текстовых клинических заметок, их несовершенством является неполнота. Например, в данных MIMIC-IV отсутствуют диспансерные протоколы у 24,5% пациентов. Другие модели, такие как изображения рентгена или результаты рентгеновских исследований, также могут применяться для извлечения представлений, однако их наличие зависит от клинических решений, что приводит к модельной непредсказуемости и многомодальной непредвиденной недостаточности (MMNAR). Наша мотивация заключается в разработке метода, который не только бы справился с этими проблемами, но и мог быть применен в различных областях медицины для повышения точности результатов. ## Метод Мы предлагаем многомодальный фреймворк, основанный на принципах причинности и информативности недостаточности моделей. Основными компонентами фреймворка являются: 1. **MMNAR-Aware Modality Fusion**: Этот модуль объединяет различные модели, включая текстовые данные, изображения и структурированные данные. Он учитывает паттерны недостаточности моделей, чтобы лучше понять состояние пациента и клинические решения. 2. **Modality Reconstruction with Contrastive Learning**: Этот модуль гарантирует, что представление будет достаточно полным и семантически наглядным, даже при отсутствии некоторых моделей. 3. **Multitask Outcome Prediction with Rectifier**: Модель предсказания результатов предназначена для корректировки остатков неточности, вызванных отложенным воздействием отсутствующих моделей. ## Результаты Мы провёряли наш метод на двух крупных датасетах: MIMIC-IV и eICU. Выполнялись эксперименты по прогнозированию двух ключевых клинических результатов: повторного возврата в госпиталь и прохождения пациента в интенсивной терапии. Наши результаты показали улучшение до 13,8% AUC в прогнозировании повторного возврата в госпиталь и 13,1% в прогнозировании прохождения в интенсивной терапии. Эти результаты показывают, что наш фреймворк превосходит существующие базовые модели, демонстрируя высокую точность и устойчивость в условиях непредсказуемой недостаточности моделей. ## Значимость Метод предлагается для применения в различных клинических сценариях, включая предсказание повторных возвратов в госпиталь и выбор лучшей стратегии лечения. Он позволяет улучшить точность медицинских решений, учитывая отсутству

Abstract

Clinical notes contain rich patient information, such as diagnoses or medications, making them valuable for patient representation learning. Recent advances in large language models have further improved the ability to extract meaningful representations from clinical texts. However, clinical notes are often missing. For example, in our analysis of the MIMIC-IV dataset, 24.5% of patients have no available discharge summaries. In such cases, representations can be learned from other modalities such as structured data, chest X-rays, or radiology reports. Yet the availability of these modalities is influenced by clinical decision-making and varies across patients, resulting in modality missing-not-at-random (MMNAR) patterns. We propose a causal representation learning framework that leverages observed data and informative missingness in multimodal clinical records. It consists of: (1) an MMNAR-aware modality fusion component that integrates structured data, imaging, and text while conditioning on missingness patterns to capture patient health and clinician-driven assignment; (2) a modality reconstruction component with contrastive learning to ensure semantic sufficiency in representation learning; and (3) a multitask outcome prediction model with a rectifier that corrects for residual bias from specific modality observation patterns. Comprehensive evaluations across MIMIC-IV and eICU show consistent gains over the strongest baselines, achieving up to 13.8% AUC improvement for hospital readmission and 13.1% for ICU admission.

Ссылки и действия