UNICON: UNIfied CONtinual Learning for Medical Foundational Models
2508.14024v1
eess.IV, cs.CV
2025-08-21
Авторы:
Mohammad Areeb Qazi, Munachiso S Nwadike, Ibrahim Almakky, Mohammad Yaqub, Numan Saeed
Резюме на русском
#### Контекст
Научные исследования в области медицинских искусственных нейронных сетей сталкиваются с систематическими вызовами, связанными с ограниченностью доступных данных. Это затрудняет подготовку фундаментальных моделей, которые должны обладать общими знаниями для различных медицинских задач, модальностей и регионов анатомии. Эти модели часто требуют больших объемов данных для каждой новой задачи или модальности, что приводит к проблеме распространенного сегментационного мышления (task-specific thinking). Для преодоления этого вызова необходимо разработать методы, которые позволят моделям беспрепятственно расширять свои возможности в новых сферах и задачах, без требования к повторной полной подготовке.
#### Метод
Мы предлагаем UNICON (UNIfied CONtinual Learning for Medical Foundational Models), универсальную архитектуру, которая объединяет в себе методы для непрерывного обучения (continual learning) и обнаружения изменений (adaptation). Фундаментальная идея заключается в том, что модель обучается последовательно на различных задачах (например, классификация, прогнозирование и сегментация) без полной переучиваемости. Основное решение заключается в использовании методов эволюционного настройки (evolutionary adaptation), которые позволяют модели сохранить эффективность на прежних задачах, при этом учитывая новые данные и задачи. Благодаря этому, UNICON может расширяться в новые модальности и анатомические регионы, не потеряв производительности на старых задачах.
#### Результаты
Мы проводили эксперименты, состоящие в том, что модель была инициально обучена для классификации образов хешт-кторт-си (chest CT). Далее, эта модель была тренирована для прогнозирования и сегментации без полной переучиваемости. Для того, чтобы проверить модель, мы также включили этапы обучения с PET-сканningами, чтобы проверить ее мощность в условиях увеличения количества данных и модальностей. Результаты показали, что модель не только сохранила производительность на прежних задачах (классификация), но и добавила новые навыки, такие как сегментирование и прогнозирование, без катастрофического забывания (catastrophic forgetting). Например, на PET-сегментации, UNICON показала 5% выигрыш в Dice-коэффициенте по сравнению с базовыми моделями.
#### Значимость
UNICON представляет собой надежный инструмент для создания generalist AI моделей в медицине, которые могут расширять свои возможности по мере поступления новых данных и задач. Эта модель позволяет не только преодолевать проблему сегментационного мышления, но и объединять различные модальности и задачи в одном модельном пространстве. Это может привести к значительным упрощениям и экономии ресурсов в области медицинского искусственного интеллекта, так как не требуется постоянное повторное обучение модели для
Abstract
Foundational models are trained on extensive datasets to capture the general
trends of a domain. However, in medical imaging, the scarcity of data makes
pre-training for every domain, modality, or task challenging. Continual
learning offers a solution by fine-tuning a model sequentially on different
domains or tasks, enabling it to integrate new knowledge without requiring
large datasets for each training phase. In this paper, we propose UNIfied
CONtinual Learning for Medical Foundational Models (UNICON), a framework that
enables the seamless adaptation of foundation models to diverse domains, tasks,
and modalities. Unlike conventional adaptation methods that treat these changes
in isolation, UNICON provides a unified, perpetually expandable framework.
Through careful integration, we show that foundation models can dynamically
expand across imaging modalities, anatomical regions, and clinical objectives
without catastrophic forgetting or task interference. Empirically, we validate
our approach by adapting a chest CT foundation model initially trained for
classification to a prognosis and segmentation task. Our results show improved
performance across both additional tasks. Furthermore, we continually
incorporated PET scans and achieved a 5\% improvement in Dice score compared to
respective baselines. These findings establish that foundation models are not
inherently constrained to their initial training scope but can evolve, paving
the way toward generalist AI models for medical imaging.
Ссылки и действия
Дополнительные ресурсы: