Do Edges Matter? Investigating Edge-Enhanced Pre-Training for Medical Image Segmentation
2508.02281v1
cs.CV, cs.LG, H.0
2025-08-09
Авторы:
Paul Zaha, Lars Böcking, Simeon Allmendinger, Leopold Müller, Niklas Kühl
Резюме на русском
Медицинское изображение является ключевым инструментом для диагностики и планирования лечения, но порой требует больших вычислительных ресурсов и больших выборок данных для обучения моделей. Эксперименты показали, что использование предобученных моделей, адаптированных к конкретным разделам медицины, может повысить качество сегментации. Однако мало известно о том, как препроцессинг изображений влияет на поведение таких моделей в различных медицинских областях. Наше исследование фокусируется на роли краевых деталей (edge features) в предобучении моделей. Мы исследовали два варианта предобучения: на оригинальных изображениях и на изображениях, подвергнутых edge-enhancement (усилению краев). Затем эти модели были дообучены на конкретных изображениях, относящихся к различным медицинским областям. Мы обнаружили, что edge-enhancement может обеим способами — улучшить или повредить — точность сегментации в зависимости от области. Для выбора оптимального варианта предобучения, мы предложили мета-стратегию на основе стандартного отклонения и энтропии изображений. Наши результаты показали, что интеграция этой мета-стратегии позволила повысить качество сегментации на 16.42% по сравнению с моделями, обученными только на edge-enhanced изображениях и на 19.30% по сравнению с моделями, обученными только на оригинальных изображениях.
Abstract
Medical image segmentation is crucial for disease diagnosis and treatment
planning, yet developing robust segmentation models often requires substantial
computational resources and large datasets. Existing research shows that
pre-trained and finetuned foundation models can boost segmentation performance.
However, questions remain about how particular image preprocessing steps may
influence segmentation performance across different medical imaging modalities.
In particular, edges-abrupt transitions in pixel intensity-are widely
acknowledged as vital cues for object boundaries but have not been
systematically examined in the pre-training of foundation models. We address
this gap by investigating to which extend pre-training with data processed
using computationally efficient edge kernels, such as kirsch, can improve
cross-modality segmentation capabilities of a foundation model. Two versions of
a foundation model are first trained on either raw or edge-enhanced data across
multiple medical imaging modalities, then finetuned on selected raw subsets
tailored to specific medical modalities. After systematic investigation using
the medical domains Dermoscopy, Fundus, Mammography, Microscopy, OCT, US, and
XRay, we discover both increased and reduced segmentation performance across
modalities using edge-focused pre-training, indicating the need for a selective
application of this approach. To guide such selective applications, we propose
a meta-learning strategy. It uses standard deviation and image entropy of the
raw image to choose between a model pre-trained on edge-enhanced or on raw data
for optimal performance. Our experiments show that integrating this
meta-learning layer yields an overall segmentation performance improvement
across diverse medical imaging tasks by 16.42% compared to models pre-trained
on edge-enhanced data only and 19.30% compared to models pre-trained on raw
data only.
Ссылки и действия
Дополнительные ресурсы: