Few-Shot Deployment of Pretrained MRI Transformers in Brain Imaging Tasks
2508.05783v1
cs.CV, cs.AI
2025-08-12
Авторы:
Mengyu Li, Guoyao Shen, Chad W. Farris, Xin Zhang
Резюме на русском
## Контекст
Машинное обучение с использованием трансформеров показало свою эффективность в области медицинской иммуниграфии. Однако, несомненно, применение этих моделей в реальной клинической практике сталкивается с рядом проблем, в том числе их зависимость от больших объемов отмеченных данных, что делает их реализацию в условиях дефицита данных весьма сложной. Наша исследовательская группа изучает возможность применения трансформеров в нейроиммуниграфии с минимальным количеством отмеченных данных. Наша мотивация заключается в том, чтобы развить методики, позволяющие эффективно использовать трансформеры в реальных клинических условиях, в том числе тех, что связаны с нейроиммуниграфией.
## Метод
Мы основываем нашу работу на формировании высококачественных представлений входных данных с помощью Masked Autoencoder (MAE). Для этих целей мы используем трансформеры в качестве модели обучения с малоизвестными объемами данных. В качестве базы данных для обучения выбрана многокогортная коллекция данных по более чем 31 миллионам срезов брайн-иммуниграфии. Для высокоуровневых задач, таких как классификация, мы применяем замороженный модуль MAE с вспомогательной линейной головкой, чтобы оптимизировать задачи идентификации последовательностей MRI. Для низкоуровневых задач, таких как сегментация, мы предлагаем гибридную архитектуру MAE-FUnet, которая объединяет мультискалярные функции CNN с эмбеддингами MAE.
## Результаты
Мы проводим ряд экспериментов, в том числе классификационные и сегментационные задачи на больших коллекциях данных. Наши результаты показывают, что MAE-фреймворк эффективно работает в ситуациях с малоизвестными данными, обеспечивая сохранение высокой точности в классификации последовательностей MRI в минимальном количестве супервайзда. Для задач сегментации мы выявили, что MAE-FUnet значительно превосходит другие модели в задачах скелетного очистки и многоклассовой сегментации анатомических структур, даже при минимальных объемах данных. Мы также проводим тестирование на различных медицинских базах данных, чтобы продемонстрировать широту применения нашего подхода.
## Значимость
Наш фреймворк имеет широкое применение в современной нейроиммуниграфии, в том числе в задачах идентификации последовательностей и сегментации. Он предлагает высокую степерь трансфертивности и эффективность, что делает его привлекательным для использования в клинических условиях с ограниченным количеством данных. Этот подход также может быть применен в других областях медицинской иммуниграфии, что увеличивает его значимость для развити
Abstract
Machine learning using transformers has shown great potential in medical
imaging, but its real-world applicability remains limited due to the scarcity
of annotated data. In this study, we propose a practical framework for the
few-shot deployment of pretrained MRI transformers in diverse brain imaging
tasks. By utilizing the Masked Autoencoder (MAE) pretraining strategy on a
large-scale, multi-cohort brain MRI dataset comprising over 31 million slices,
we obtain highly transferable latent representations that generalize well
across tasks and datasets. For high-level tasks such as classification, a
frozen MAE encoder combined with a lightweight linear head achieves
state-of-the-art accuracy in MRI sequence identification with minimal
supervision. For low-level tasks such as segmentation, we propose MAE-FUnet, a
hybrid architecture that fuses multiscale CNN features with pretrained MAE
embeddings. This model consistently outperforms other strong baselines in both
skull stripping and multi-class anatomical segmentation under data-limited
conditions. With extensive quantitative and qualitative evaluations, our
framework demonstrates efficiency, stability, and scalability, suggesting its
suitability for low-resource clinical environments and broader neuroimaging
applications.
Ссылки и действия
Дополнительные ресурсы: