Few-Shot Deployment of Pretrained MRI Transformers in Brain Imaging Tasks

2508.05783v1 cs.CV, cs.AI 2025-08-12

Авторы:

Mengyu Li, Guoyao Shen, Chad W. Farris, Xin Zhang

Резюме на русском

## Контекст Машинное обучение с использованием трансформеров показало свою эффективность в области медицинской иммуниграфии. Однако, несомненно, применение этих моделей в реальной клинической практике сталкивается с рядом проблем, в том числе их зависимость от больших объемов отмеченных данных, что делает их реализацию в условиях дефицита данных весьма сложной. Наша исследовательская группа изучает возможность применения трансформеров в нейроиммуниграфии с минимальным количеством отмеченных данных. Наша мотивация заключается в том, чтобы развить методики, позволяющие эффективно использовать трансформеры в реальных клинических условиях, в том числе тех, что связаны с нейроиммуниграфией. ## Метод Мы основываем нашу работу на формировании высококачественных представлений входных данных с помощью Masked Autoencoder (MAE). Для этих целей мы используем трансформеры в качестве модели обучения с малоизвестными объемами данных. В качестве базы данных для обучения выбрана многокогортная коллекция данных по более чем 31 миллионам срезов брайн-иммуниграфии. Для высокоуровневых задач, таких как классификация, мы применяем замороженный модуль MAE с вспомогательной линейной головкой, чтобы оптимизировать задачи идентификации последовательностей MRI. Для низкоуровневых задач, таких как сегментация, мы предлагаем гибридную архитектуру MAE-FUnet, которая объединяет мультискалярные функции CNN с эмбеддингами MAE. ## Результаты Мы проводим ряд экспериментов, в том числе классификационные и сегментационные задачи на больших коллекциях данных. Наши результаты показывают, что MAE-фреймворк эффективно работает в ситуациях с малоизвестными данными, обеспечивая сохранение высокой точности в классификации последовательностей MRI в минимальном количестве супервайзда. Для задач сегментации мы выявили, что MAE-FUnet значительно превосходит другие модели в задачах скелетного очистки и многоклассовой сегментации анатомических структур, даже при минимальных объемах данных. Мы также проводим тестирование на различных медицинских базах данных, чтобы продемонстрировать широту применения нашего подхода. ## Значимость Наш фреймворк имеет широкое применение в современной нейроиммуниграфии, в том числе в задачах идентификации последовательностей и сегментации. Он предлагает высокую степерь трансфертивности и эффективность, что делает его привлекательным для использования в клинических условиях с ограниченным количеством данных. Этот подход также может быть применен в других областях медицинской иммуниграфии, что увеличивает его значимость для развити

Abstract

Machine learning using transformers has shown great potential in medical imaging, but its real-world applicability remains limited due to the scarcity of annotated data. In this study, we propose a practical framework for the few-shot deployment of pretrained MRI transformers in diverse brain imaging tasks. By utilizing the Masked Autoencoder (MAE) pretraining strategy on a large-scale, multi-cohort brain MRI dataset comprising over 31 million slices, we obtain highly transferable latent representations that generalize well across tasks and datasets. For high-level tasks such as classification, a frozen MAE encoder combined with a lightweight linear head achieves state-of-the-art accuracy in MRI sequence identification with minimal supervision. For low-level tasks such as segmentation, we propose MAE-FUnet, a hybrid architecture that fuses multiscale CNN features with pretrained MAE embeddings. This model consistently outperforms other strong baselines in both skull stripping and multi-class anatomical segmentation under data-limited conditions. With extensive quantitative and qualitative evaluations, our framework demonstrates efficiency, stability, and scalability, suggesting its suitability for low-resource clinical environments and broader neuroimaging applications.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Few-Shot Deployment of Pretrained MRI Transformers in Brain Imaging Tasks

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Dual-Stream Spectral Decoupling Distillation for Remote Sensing Object Detection

Explainable Parkinsons Disease Gait Recognition Using Multimodal RGB-D Fusion an...

GuidNoise: Single-Pair Guided Diffusion for Generalized Noise Synthesis

PhyVLLM: Physics-Guided Video Language Model with Motion-Appearance Disentanglem...

Detection of Intoxicated Individuals from Facial Video Sequences via a Recurrent...

Навигация