UNICON: UNIfied CONtinual Learning for Medical Foundational Models

2508.14024v1 eess.IV, cs.CV 2025-08-21
Авторы:

Mohammad Areeb Qazi, Munachiso S Nwadike, Ibrahim Almakky, Mohammad Yaqub, Numan Saeed

Резюме на русском

#### Контекст Научные исследования в области медицинских искусственных нейронных сетей сталкиваются с систематическими вызовами, связанными с ограниченностью доступных данных. Это затрудняет подготовку фундаментальных моделей, которые должны обладать общими знаниями для различных медицинских задач, модальностей и регионов анатомии. Эти модели часто требуют больших объемов данных для каждой новой задачи или модальности, что приводит к проблеме распространенного сегментационного мышления (task-specific thinking). Для преодоления этого вызова необходимо разработать методы, которые позволят моделям беспрепятственно расширять свои возможности в новых сферах и задачах, без требования к повторной полной подготовке. #### Метод Мы предлагаем UNICON (UNIfied CONtinual Learning for Medical Foundational Models), универсальную архитектуру, которая объединяет в себе методы для непрерывного обучения (continual learning) и обнаружения изменений (adaptation). Фундаментальная идея заключается в том, что модель обучается последовательно на различных задачах (например, классификация, прогнозирование и сегментация) без полной переучиваемости. Основное решение заключается в использовании методов эволюционного настройки (evolutionary adaptation), которые позволяют модели сохранить эффективность на прежних задачах, при этом учитывая новые данные и задачи. Благодаря этому, UNICON может расширяться в новые модальности и анатомические регионы, не потеряв производительности на старых задачах. #### Результаты Мы проводили эксперименты, состоящие в том, что модель была инициально обучена для классификации образов хешт-кторт-си (chest CT). Далее, эта модель была тренирована для прогнозирования и сегментации без полной переучиваемости. Для того, чтобы проверить модель, мы также включили этапы обучения с PET-сканningами, чтобы проверить ее мощность в условиях увеличения количества данных и модальностей. Результаты показали, что модель не только сохранила производительность на прежних задачах (классификация), но и добавила новые навыки, такие как сегментирование и прогнозирование, без катастрофического забывания (catastrophic forgetting). Например, на PET-сегментации, UNICON показала 5% выигрыш в Dice-коэффициенте по сравнению с базовыми моделями. #### Значимость UNICON представляет собой надежный инструмент для создания generalist AI моделей в медицине, которые могут расширять свои возможности по мере поступления новых данных и задач. Эта модель позволяет не только преодолевать проблему сегментационного мышления, но и объединять различные модальности и задачи в одном модельном пространстве. Это может привести к значительным упрощениям и экономии ресурсов в области медицинского искусственного интеллекта, так как не требуется постоянное повторное обучение модели для

Abstract

Foundational models are trained on extensive datasets to capture the general trends of a domain. However, in medical imaging, the scarcity of data makes pre-training for every domain, modality, or task challenging. Continual learning offers a solution by fine-tuning a model sequentially on different domains or tasks, enabling it to integrate new knowledge without requiring large datasets for each training phase. In this paper, we propose UNIfied CONtinual Learning for Medical Foundational Models (UNICON), a framework that enables the seamless adaptation of foundation models to diverse domains, tasks, and modalities. Unlike conventional adaptation methods that treat these changes in isolation, UNICON provides a unified, perpetually expandable framework. Through careful integration, we show that foundation models can dynamically expand across imaging modalities, anatomical regions, and clinical objectives without catastrophic forgetting or task interference. Empirically, we validate our approach by adapting a chest CT foundation model initially trained for classification to a prognosis and segmentation task. Our results show improved performance across both additional tasks. Furthermore, we continually incorporated PET scans and achieved a 5\% improvement in Dice score compared to respective baselines. These findings establish that foundation models are not inherently constrained to their initial training scope but can evolve, paving the way toward generalist AI models for medical imaging.

Ссылки и действия