Deep Active Learning for Lung Disease Severity Classification from Chest X-rays: Learning with Less Data in the Presence of Class Imbalance

2508.21263v1 eess.IV, cs.AI, cs.LG 2025-09-02
Авторы:

Roy M. Gabriel, Mohammadreza Zandehshahvar, Marly van Assen, Nattakorn Kittisut, Kyle Peters, Carlo N. De Cecco, Ali Adibi

Резюме на русском

#### Контекст Ранний диагноз и ранняя стадия лечения заболеваний, в том числе легочных, является ключевым фактором успешного лечения и предотвращения серьезных осложнений. Одним из наиболее распространенных средств диагностики являются рентгеновые исследования легких (Chest X-rays, CXRs). Однако традиционный метод диагностики на основе ручного анализа CXRs требует опытных специалистов и значительного времени. Более того, многие больные не имеют доступа к такому диагностическому обслуживанию из-за нехватки квалифицированных специалистов. Дополнительно, классификация заболеваний по тяжести часто сталкивается с проблемой несбалансированных классов в данных, что создает дополнительные затруднения для обучения эффективных моделей. #### Метод В данном исследовании рассматривается deep active learning (ДАЛ) как метод для эффективного обучения моделей с меньшим количеством меток. Использовалась аппроксимация Bayesian Neural Network (BNN) для уменьшения вероятности overfitting и повышения уверенности в прогнозировании. Для обработки несбалансированных классов применялась весовая функция потерь. Модель обучалась с использованием Monte Carlo Dropout, чтобы уменьшить вероятность переобучения и повысить устойчивость модели к шуму. Для выбора самых информативных образцов из необученного корпуса использовались различные acquisition functions (например, Entropy Sampling и Mean STD Sampling). Экспериментальное исследование проводилось на 2319 CXRs от 963 пациентов с COVID-19, подвергшимися классификации по тяжести заболевания (нормальное состояние, умеренная и серьезная тяжесть). #### Результаты С помощью Entropy Sampling, модель с BNN и весовой функцией потерь показала 93.7% точности в бинарной классификации (нормальное состояние vs. заболевание), используя всего 15.4% от общего количества данных. В многоклассовой классификации (три класса тяжести), Mean STD Sampling достигла 70.3% точности, используя лишь 23.1% меток. Эти результаты были более эффективными по сравнению с более сложными и вычислительно трудозатратными методами, такими как BALD (Batch-Active Learning by Diverse Gradient Estimation). Был также отмечен значительный экономия во времени обучения и выборки, что открывает возможность применения этого подхода в реальном времени. #### Значимость Результаты исследования демонстрируют, что ДАЛ с BNN и весовой функцией потерь может эффективно использоваться для классификации тяжести легочных заболеваний, даже при несбалансированных классах. Это позволяет снизить требования к количеству меток, необходимых для обучения моделей, и улучшить скорость реагирования в критических ситуациях, таких как лечение COVID-19. Модель может

Abstract

To reduce the amount of required labeled data for lung disease severity classification from chest X-rays (CXRs) under class imbalance, this study applied deep active learning with a Bayesian Neural Network (BNN) approximation and weighted loss function. This retrospective study collected 2,319 CXRs from 963 patients (mean age, 59.2 $\pm$ 16.6 years; 481 female) at Emory Healthcare affiliated hospitals between January and November 2020. All patients had clinically confirmed COVID-19. Each CXR was independently labeled by 3 to 6 board-certified radiologists as normal, moderate, or severe. A deep neural network with Monte Carlo Dropout was trained using active learning to classify disease severity. Various acquisition functions were used to iteratively select the most informative samples from an unlabeled pool. Performance was evaluated using accuracy, area under the receiver operating characteristic curve (AU ROC), and area under the precision-recall curve (AU PRC). Training time and acquisition time were recorded. Statistical analysis included descriptive metrics and performance comparisons across acquisition strategies. Entropy Sampling achieved 93.7% accuracy (AU ROC, 0.91) in binary classification (normal vs. diseased) using 15.4% of the training data. In the multi-class setting, Mean STD sampling achieved 70.3% accuracy (AU ROC, 0.86) using 23.1% of the labeled data. These methods outperformed more complex and computationally expensive acquisition functions and significantly reduced labeling needs. Deep active learning with BNN approximation and weighted loss effectively reduces labeled data requirements while addressing class imbalance, maintaining or exceeding diagnostic performance.

Ссылки и действия

Связанные статьи

HOTSPOT-YOLO: A Lightweight Deep Learning Attention-Driven Model for Detecting T...

#### Контекст Тепловые аномалии в солнечных панелях, такие как горячие точки (hotspots), являются критически важной про...

2025-08-28

A Comprehensive Framework for Uncertainty Quantification of Voxel-wise Supervise...

## КОНТЕКСТ И ПРОБЛЕМАТИКА Оценка параметров intravoxel incoherent motion (IVIM) из диффузионно-взвешенной МРТ (DW-MRI)...

2025-08-09