Clinical Expert Uncertainty Guided Generalized Label Smoothing for Medical Noisy Label Learning

2508.02495v2 cs.LG, cs.CV 2025-08-09
Авторы:

Kunyu Zhang, Lin Gu, Liangchen Liu, Yingke Chen, Binyang Wang, Jin Yan, Yingying Zhu

Резюме на русском

Многие исследования используют тексты клинических заметок для создания больших медицинских имидж-датасетов с минимальными затратами. Однако эти методы страдают от шума в меток, вызванного неопределенностью в клинических заметках. Радиологи и врачи часто оставляют неопределенные замечания, например, "может быть" или "не исключено", что приводит к шуму в метках. Несмотря на развитие методов по определению меток, эти неявные неуверенности не учитываются, что приводит к появлению шума в метках. Наша работа предлагает метод обучения с учетом неопределенности клинических заметок, используя метод гладкого значения меток (Generalized Label Smoothing). Мы проанализировали влияние неопределенности клинических заметоток на шум меток, разработали бенчмарк для экспертной неопределенности и улучшили существующие подходы к обучению в условиях шума меток, продемонстрировав эффективность наших методов.

Abstract

Many previous studies have proposed extracting image labels from clinical notes to create large-scale medical image datasets at a low cost. However, these approaches inherently suffer from label noise due to uncertainty from the clinical experts. When radiologists and physicians analyze medical images to make diagnoses, they often include uncertainty-aware notes such as ``maybe'' or ``not excluded''. Unfortunately, current text-mining methods overlook these nuances, resulting in the creation of noisy labels. Existing methods for handling noisy labels in medical image analysis, which typically address the problem through post-processing techniques, have largely ignored the important issue of expert-driven uncertainty contributing to label noise. To better incorporate the expert-written uncertainty in clinical notes into medical image analysis and address the label noise issue, we first examine the impact of clinical expert uncertainty on label noise. We then propose a clinical expert uncertainty-aware benchmark, along with a label smoothing method, which significantly improves performance compared to current state-of-the-art approaches.

Ссылки и действия