Semi-Supervised 3D Medical Segmentation from 2D Natural Images Pretrained Model

2509.15167v1 cs.CV, cs.AI, cs.LG 2025-09-20

Авторы:

Pak-Hei Yeung, Jayroop Ramesh, Pengfei Lyu, Ana Namburete, Jagath Rajapakse

Резюме на русском

#### Контекст В области медицинского исследования, важность точного анализа медицинских изображений несомненна. Несмотря на прогресс в 3D-сегментации медицинских изображений, ограниченность методов получения масштабных медицинских данных для обучения ограничивает эффективность существующих моделей. Эта проблема усиливается в условиях нехватки меток для тренировочных данных. Поэтому, открытым вопросом является передача знаний из общих моделей визуального восприятия, обученных на 2D-изображениях, для улучшения 3D-сегментации медицинских изображений. #### Метод Мы предлагаем модель-агностический фреймворк, названный M&N, который использует квази-метки, генерируемые двумя моделями, которые обучают друг друга в итеративном режиме. В начале, 2D-модель (pretrained on 2D natural images) и 3D-сегментационная модель (обученная с нуля) обучаются в параллельном режиме. В дальнейшем, квази-метки 2D-модели используются для обучения 3D-модели, а квази-метки 3D-модели — для улучшения 2D-модели. Для того, чтобы повысить точность квази-меток, мы внедрили метод управления скоростью обучения, который адаптивно изменяет веса между меток для обучения в зависимости от достоверности моделей. #### Результаты Мы провели эксперименты на нескольких медицинских данных, включая популярные наборы данных, такие как 3D MRI и CT-сканы. Модель M&N показала существенное улучшение в сравнении с 13 существующими методами, оформленными в работах, применяемых в случае недостатка меток. Она подтвердила свой статус лучшей подходящей методики в разных условиях обучения (с разным количеством меток). Более того, наши аблационные эксперименты показали, что M&N не зависит от конкретной архитектуры 3D-модели, что делает ее универсальной для использования с различными архитектурами. #### Значимость Предлагаемый подход имеет широкие применение в медицине, особенно в случаях нехватки меток для тренировочных данных. Он может повысить точность сегментации 3D-моделей и сделать их доступнее для разработчиков, не обладающих большим объемом медицинских данных. Также, адаптивность M&N к различным архитектурам 3D-моделей позволит применять его в будущих разработках. Этот подход может привести к повышению качества диагностики и уменьшению времени, необходимого для получения результатов медицинского анализа. #### Выводы Мы доказали, что фреймворк M&N позволяет эффективно передавать знания из моделей визуального восприятия, обученных на 2D-изображениях, для улучшения 3D-сегментации медицинских изображений. Наши результаты показали, что M&N подходит для разли

Abstract

This paper explores the transfer of knowledge from general vision models pretrained on 2D natural images to improve 3D medical image segmentation. We focus on the semi-supervised setting, where only a few labeled 3D medical images are available, along with a large set of unlabeled images. To tackle this, we propose a model-agnostic framework that progressively distills knowledge from a 2D pretrained model to a 3D segmentation model trained from scratch. Our approach, M&N, involves iterative co-training of the two models using pseudo-masks generated by each other, along with our proposed learning rate guided sampling that adaptively adjusts the proportion of labeled and unlabeled data in each training batch to align with the models' prediction accuracy and stability, minimizing the adverse effect caused by inaccurate pseudo-masks. Extensive experiments on multiple publicly available datasets demonstrate that M&N achieves state-of-the-art performance, outperforming thirteen existing semi-supervised segmentation approaches under all different settings. Importantly, ablation studies show that M&N remains model-agnostic, allowing seamless integration with different architectures. This ensures its adaptability as more advanced models emerge. The code is available at https://github.com/pakheiyeung/M-N.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Semi-Supervised 3D Medical Segmentation from 2D Natural Images Pretrained Model

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

PyroFocus: A Deep Learning Approach to Real-Time Wildfire Detection in Multispec...

ProtoEFNet: Dynamic Prototype Learning for Inherently Interpretable Ejection Fra...

GalaxyDiT: Efficient Video Generation with Guidance Alignment and Adaptive Proxy...

Divide, then Ground: Adapting Frame Selection to Query Types for Long-Form Video...

PSA: Pyramid Sparse Attention for Efficient Video Understanding and Generation

Навигация