Deep Learning with Self-Attention and Enhanced Preprocessing for Precise Diagnosis of Acute Lymphoblastic Leukemia from Bone Marrow Smears in Hemato-Oncology
2508.17216v1
cs.CV, cs.LG, I.2.6; I.4.6; I.5.4; J.3
2025-08-27
Авторы:
Md. Maruf, Md. Mahbubul Haque, Bishowjit Paul
Резюме на русском
## Контекст
Acute lymphoblastic leukemia (ALL) является частым типом лейкоза, как у детей, так и у взрослых. Его ранняя и точная диагностика, включая подтипировку, крайне важна для выбора эффективного лечения. Однако существующие рабочие процессы диагностики требуют больших усилий, требуют много времени и чувствительны к человеческим ошибкам. Нейронные сети становятся мощным инструментом для автоматизации диагностики, однако необходимо их улучшение для обеспечения высокой точности и достоверности в работе с реальными медицинскими данными.
## Метод
Мы предлагаем биомедицинскую систему для обнаружения ALL, основанную на глубинных нейронных сетях с использованием многоголосного самоп paуживания (MHSA). Этот метод внедряется в сеть VGG19 для моделирования связности между клетками. Для того чтобы улучшить интерпретируемость и эффективность, мы внедрили стабилизированную предобработку изображений. Также, для адресации проблемы несбалансированных классов, мы использовали Focal Loss. Это позволило системе улучшить свою точность и уменьшить погрешность при различных объемах данных.
## Результаты
Мы провели эксперименты с использованием небольшого, но высококачественного датасета, содержащего изображения бонных марров с признаками ALL. Улучшенная модель VGG19+MHSA с Focal Loss достигла 99.25% точности, что значительно превышает результаты модели ResNet101 (98.62%). Эти результаты показывают, что самоп paуживание самостоятельно может быть полезно для моделирования взаимосвязей клеток и повышения точности диагностики.
## Значимость
Наше решение может использоваться для быстрого и точного распознавания типов лейкоза, что уменьшит нагрузку на клинических экспертов и повысит точность диагностики. Это может привести к более эффективному управлению лечением и улучшению прогноза для пациентов.
## Выводы
Мы установили, что глубинные нейронные сети с многоголосным самоп paуживанием могут повысить точность диагностики ALL. Наша работа показывает, что такие модели могут стать ключевым инструментом для сверхточной диагностики на основе медицинских изображений. Мы планируем расширить нашу модель для учета дополнительных факторов, таких как подтипы лейкоза и выявление раннего стадии.
Abstract
Acute lymphoblastic leukemia (ALL) is a prevalent hematological malignancy in
both pediatric and adult populations. Early and accurate detection with precise
subtyping is essential for guiding therapy. Conventional workflows are complex,
time-consuming, and prone to human error. We present a deep learning framework
for automated ALL diagnosis from bone marrow smear images. The method combines
a robust preprocessing pipeline with convolutional neural networks (CNNs) to
standardize image quality and improve inference efficiency. As a key design, we
insert a multi-head self-attention (MHSA) block into a VGG19 backbone to model
long-range dependencies and contextual relationships among cellular features.
To mitigate class imbalance, we train with Focal Loss. Across evaluated
architectures, the enhanced VGG19+MHSA trained with Focal Loss achieves 99.25%
accuracy, surpassing a strong ResNet101 baseline (98.62%). These results
indicate that attention-augmented CNNs, coupled with targeted loss optimization
and preprocessing, yield more discriminative representations of leukemic cell
morphology. Our approach offers a highly accurate and computationally efficient
tool for automated ALL recognition and subtyping, with potential to accelerate
diagnostic workflows and support reliable decision-making in clinical settings.