Class Unbiasing for Generalization in Medical Diagnosis

2508.06943v1 cs.LG, cs.AI 2025-08-13

Авторы:

Lishi Zuo, Man-Wai Mak, Lu Yi, Youzhi Tu

Резюме на русском

## Контекст Медицинская диагностика является ключевым компонентом системы здравоохранения, позволяющей определить заболевания и принять соответствующие меры. Однако существуют значительные проблемы, связанные с биасами в данных и алгоритмах. Биасы могут приводить к недооценке или переоценке определенных классов, что приводит к неточным диагнозам и неэффективному применению ресурсов. Одним из важных видов биаса является **class-feature bias**, когда модель ориентируется на функции, которые сильно коррелируют только с некоторыми классами, что приводит к непослужительной производительности и плохой общей применимости на других классах. Данная работа адресует эту проблему, стремясь разработать метод, который уменьшит степень биаса и улучшит общее качество диагностики. ## Метод Метод, предложенный в работе, называется **Cls-unbias**, который призван обучать модели, учитывающие все классы равномерно, минимизируя при этом влияние класс-фичевого биаса. Метод основывается на двух основных компонентах: 1. **Class-wise Inequality Loss**: Этот лосс призван выравнивать вклады отдельных классов в обучение модели. Он поощряет равномерное влияние каждого класса на обучение, компенсируя влияние класс-фичевого биаса. 2. **Class-wise Group Distributionally Robust Optimization (C-wGDRO)**: Это оптимизационная техника, которая увеличивает веса менее эффективных классов в процессе тренировки. Это позволяет улучшить общую обнаружительность, даже при несбалансированных классах. Технически, алгоритм использует класс-веса для управления потерями и вкладом каждого класса в обучение. Эта архитектура позволяет модели ориентироваться на все классы равномерно, уменьшая влияние класс-фичевого биаса. ## Результаты Эксперименты проводились на двух типах данных: синтетических и реальных медицинских данных. В синтетических данных был симулирован класс-фичевой биас, а в реальных данных использовались реальные медицинские данные. Результаты показывают, что: - Модель Cls-unbias существенно улучшает доброту диагностики по сравнению с базовыми моделями. - Метод эффективно уменьшает влияние класс-фичевого биаса, улучшая производительность для менее представительных классов. - Он также улучшает общую обнаружительность, даже в условиях несбалансированности классов. Эти результаты иллюстрируют, что Cls-unbias эффективно компенсирует класс-фичевый биас и улучшает общую обнаружительность моделей в медицинской диагностике. ## Значимость Разработанный метод имеет широкое применение в следующих областях: 1. **Медицинская д

Abstract

Medical diagnosis might fail due to bias. In this work, we identified class-feature bias, which refers to models' potential reliance on features that are strongly correlated with only a subset of classes, leading to biased performance and poor generalization on other classes. We aim to train a class-unbiased model (Cls-unbias) that mitigates both class imbalance and class-feature bias simultaneously. Specifically, we propose a class-wise inequality loss which promotes equal contributions of classification loss from positive-class and negative-class samples. We propose to optimize a class-wise group distributionally robust optimization objective-a class-weighted training objective that upweights underperforming classes-to enhance the effectiveness of the inequality loss under class imbalance. Through synthetic and real-world datasets, we empirically demonstrate that class-feature bias can negatively impact model performance. Our proposed method effectively mitigates both class-feature bias and class imbalance, thereby improving the model's generalization ability.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Class Unbiasing for Generalization in Medical Diagnosis

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Prototype-Based Semantic Consistency Alignment for Domain Adaptive Retrieval

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

TimesNet-Gen: Deep Learning-based Site Specific Strong Motion Generation

Realizable Abstractions: Near-Optimal Hierarchical Reinforcement Learning

BEP: A Binary Error Propagation Algorithm for Binary Neural Networks Training

Навигация