Large-scale Multi-sequence Pretraining for Generalizable MRI Analysis in Versatile Clinical Applications

2508.07165v1 eess.IV, cs.AI, cs.CV 2025-08-13

Авторы:

Zelin Qiu, Xi Wang, Zhuoyao Xie, Juan Zhou, Yu Wang, Lingjie Yang, Xinrui Jiang, Juyoung Bae, Moo Hyun Son, Qiang Ye, Dexuan Chen, Rui Zhang, Tao Li, Neeraj Ramesh Mahboobani, Varut Vardhanabhuti, Xiaohui Duan, Yinghua Zhao, Hao Chen

Резюме на русском

#### Контекст Многосеквентное магнитное резонансное исследование (МРИ) является важной методикой в радиологии, позволяющей различать разные типы тканей благодаря использованию различных секвенций. Однако, несмотря на свою гибкость, данная методика сталкивается с значительными проблемами в области генерализуемости динамических моделей, особенно в случае с изменением параметров активации. Эти модели часто сталкиваются с проблемой недостаточной универсальности при применении к разнородным данным, что затрудняет их адаптацию к различным клиническим задачам. Большинство существующих моделей не включают в свой кадр различные секвенции МРИ, что приводит к потерям в общей универсальности и стабильности моделей. Таким образом, существует необходимость в разработке моделей, которые могут объединить различные секвенции МРИ, чтобы обеспечить лучшую прогностическую способность, активность и общую генерализуемость. #### Метод Мы предлагаем PRISM (PRe-trained with large-scale multI-Sequence MRI) как основную модель с предварительной обученной сетью, которая подразумевает расширенную многосеквентную обработку MRI. Мы собрали большую коллекцию данных из 64 различных наборов данных, включая 8 публичных и 26 частных датасетов, содержащих видео изображения, полученные с различных секвенций МРИ. Для построения основной модели мы использовали 336,476 вольтровных МРИ-сканов, различающихся по типу тканей и исследовательским подходом. Предлагаемая модель включает в свой архитектурный подход два основных момента: 1. Отделение анатомически независимых функций от последовательностей, связанных с МРИ. 2. Обеспечение высокоуровневых семантических представлений, которые могут быть использованы для различных задач в клинической практике. Мы использовали нелинейные модели, которые были обучены с помощью данных с различных секвенций, чтобы сформировать общую модель, удовлетворяющую требованиям многозначной клинической аналитики. #### Результаты Мы проводили эксперименты для оценки модели PRISM на 44 различных клинических задачах, включая задачи диагностики, сегментации изображений, регистрации, прогноза течения заболевания и генерации текстовых отчетов. Модель была проверена на 32 публичных и 5 частных когортных данных. Результаты показали, что PRISM стабильно выполняет лучше остальных непредварительно обученных моделей и даже некоторых существующих основных моделей. Она достигла победы с статистически значимыми улучшениями в 39 из 44 задач, что демонстрирует ее высокую генерализуемость и устойчивость к различным секвенци

Abstract

Multi-sequence Magnetic Resonance Imaging (MRI) offers remarkable versatility, enabling the distinct visualization of different tissue types. Nevertheless, the inherent heterogeneity among MRI sequences poses significant challenges to the generalization capability of deep learning models. These challenges undermine model performance when faced with varying acquisition parameters, thereby severely restricting their clinical utility. In this study, we present PRISM, a foundation model PRe-trained with large-scale multI-Sequence MRI. We collected a total of 64 datasets from both public and private sources, encompassing a wide range of whole-body anatomical structures, with scans spanning diverse MRI sequences. Among them, 336,476 volumetric MRI scans from 34 datasets (8 public and 26 private) were curated to construct the largest multi-organ multi-sequence MRI pretraining corpus to date. We propose a novel pretraining paradigm that disentangles anatomically invariant features from sequence-specific variations in MRI, while preserving high-level semantic representations. We established a benchmark comprising 44 downstream tasks, including disease diagnosis, image segmentation, registration, progression prediction, and report generation. These tasks were evaluated on 32 public datasets and 5 private cohorts. PRISM consistently outperformed both non-pretrained models and existing foundation models, achieving first-rank results in 39 out of 44 downstream benchmarks with statistical significance improvements. These results underscore its ability to learn robust and generalizable representations across unseen data acquired under diverse MRI protocols. PRISM provides a scalable framework for multi-sequence MRI analysis, thereby enhancing the translational potential of AI in radiology. It delivers consistent performance across diverse imaging protocols, reinforcing its clinical applicability.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Large-scale Multi-sequence Pretraining for Generalizable MRI Analysis in Versatile Clinical Applications

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

MICCAI STS 2024 Challenge: Semi-Supervised Instance-Level Tooth Segmentation in ...

When Do Domain-Specific Foundation Models Justify Their Cost? A Systematic Evalu...

Adversarial Multi-Task Learning for Liver Tumor Segmentation, Dynamic Enhancemen...

Not Quite Anything: Overcoming SAMs Limitations for 3D Medical Imaging

Shape-Adapting Gated Experts: Dynamic Expert Routing for Colonoscopic Lesion Seg...

Навигация