Dynamic Survival Prediction using Longitudinal Images based on Transformer

2508.09328v1 eess.IV, cs.CV, stat.AP, stat.OT 2025-08-15
Авторы:

Bingfan Liu, Haolun Shi, Jiguo Cao

Резюме на русском

#### Контекст Survival analysis является ключевым инструментом в медицинской диагностике и прогнозировании, особенно при раннем выявлении и оценке прогноза заболеваний. Традиционные подходы часто ограничиваются однослойным анализом одной или нескольких медицинских картинок или структурированных данных, недостаточно учитывая сложности взаимосвязей между многомерными данными. Недостаток интерпретируемости и эффективности таких подходов приводит к значительным ограничениям в практическом применении survival analysis. Наша мотивация заключается в развитии метода, который мог бы объединить несколько медицинских изображений, измеренных на различных моментах времени, с структурированными данными для более точной и интерпретируемой оценки срока выживания. #### Метод Мы предлагаем SurLonFormer, новую архитектуру на базе Transformer, которая объединяет три составляющих: **Vision Encoder**, **Sequence Encoder** и **Survival Encoder**. Vision Encoder извлекает пространственные признаки из медицинских изображений, а Sequence Encoder агрегирует информацию о временных изменениях. Survival Encoder, основанный на модели Cox proportional hazards, интегрирует эти компоненты для точной оценки срока выживания. Этот подход позволяет эффективно обрабатывать censored data, учитывать корреляции между медицинскими изображениями, измеренными на разных моментах времени, и обеспечивает интерпретируемость результатов с помощью occlusion sensitivity analysis. #### Результаты Мы провести обширные эксперименты на симуляционных данных и реальных медицинских измерениях, включая задачу оценки срока выживания при Alzheimer's disease. SurLonFormer показал высокую точность и стабильность в прогностической моделировании, когда использовались данные из нескольких моментов времени. Модель также продемонстрировала высокую интерпретируемость, выделив значимые динамические характеристики, связанные с заболеванием. В сравнении с другими подходами, SurLonFormer показал значительные преимущества в объеме прогнозируемой информации и точности выявления образов, связанных с заболеванием. #### Значимость Наш подход может быть широко применен в диагностике, прогнозировании и мониторинге многих медицинских заболеваний, где необходимо учитывать динамические изменения, основанные на многомерных данных. SurLonFormer обеспечивает новый уровень точности и интерпретируемости, объединяя принципы Transformer-архитектур с медицинскими задачами. Это может привести к значительным улучшениям в практическом применении survival analysis в клинической практике. #### Выводы SurLonFormer достиг высокой точности в survival prediction, объединив медицинские изображения и структурированные данные. Мы также идентифицировали принципиальные динамические характеристики, связанные с заболеванием, которые могут быть использованы в буду

Abstract

Survival analysis utilizing multiple longitudinal medical images plays a pivotal role in the early detection and prognosis of diseases by providing insight beyond single-image evaluations. However, current methodologies often inadequately utilize censored data, overlook correlations among longitudinal images measured over multiple time points, and lack interpretability. We introduce SurLonFormer, a novel Transformer-based neural network that integrates longitudinal medical imaging with structured data for survival prediction. Our architecture comprises three key components: a Vision Encoder for extracting spatial features, a Sequence Encoder for aggregating temporal information, and a Survival Encoder based on the Cox proportional hazards model. This framework effectively incorporates censored data, addresses scalability issues, and enhances interpretability through occlusion sensitivity analysis and dynamic survival prediction. Extensive simulations and a real-world application in Alzheimer's disease analysis demonstrate that SurLonFormer achieves superior predictive performance and successfully identifies disease-related imaging biomarkers.

Ссылки и действия