Ultrasound-based detection and malignancy prediction of breast lesions eligible for biopsy: A multi-center clinical-scenario study using nomograms, large language models, and radiologist evaluation

2509.00946v1 eess.IV, cs.CV 2025-09-05
Авторы:

Ali Abbasian Ardakani, Afshin Mohammadi, Taha Yusuf Kuzan, Beyza Nur Kuzan, Hamid Khorshidi, Ashkan Ghorbani, Alisa Mohebbi, Fariborz Faeghi, Sepideh Hatamikia, U Rajendra Acharya

Резюме на русском

#### Контекст Оценка лимфомы и её классификация в области онкологии и радиологии является ключевым аспектом диагностики и терапии. Несмотря на развитие изобразительных методов, повышение точности диагноза и предсказания клинических результатов остается вызовом. Особенностью заболеваний лимфомы является их широкий спектр клинических проявлений и разнообразие биологических свойств, что затрудняет объединение подходов к диагностике. Необходимость в развитии методов, объединяющих клинические, иммунологические и индивидуальные медицинские данные, является мотивацией для этого исследования. #### Метод Исследование основывается на многоцентровой коллекции пациентов с утвержденными патологическими выявлениями лимфомы. Использовались данные по 1747 женщинам с биопсийно подтвержденными подозрениями на рак груди. Для каждой железы извлечены 10 BIRADS-признаков и 26 морфометрических характеристик. Номинаторы, включающие эти признаки, построены с помощью логистической регрессии. Дополнительно, дезидентифицированные изображения желез разделены на тренировочную и валидационную выборку. Проведены сравнительные эксперименты с использованием статистических моделей, моделей машинного обучения и оценки трёх радиологов (один старший, два общих). #### Результаты В целом, статистическая модель, объединяющая BIRADS и морфометрические признаки, показала наивысшую точность в рекомендации биопсии (83.0%) и предсказании мальиности (83.8%). Эта модель превзошла отдельные модели (BIRADS и морфометрические), трёх радиологов и двух моделей текстовых генераторов (ChatGPT). Внешняя валидация показала высокую общую ценность и генерализуемость модели в разных ультразвуковых системах и демографических группах. #### Значимость Результаты имеют перспективу для улучшения клинических решений в области рак груди. Интегрированные BIRADS-морфометрические номинаторы предлагают интерпретируемый инструмент для уменьшения числа ненужных биопсий и повышения точности классификации. Инновационные подходы, основанные на глубоком обучении и номинации, могут способствовать более персонализированной и эффективной медицинской практике. #### Выводы Интегрированные BIRADS-морфометрические номинаторы доказали свою превосходность по сравнению с отдельными моделями и экспертной оценкой. Они обеспечивают перспективу для повышения точности диагноза и понижения риска ненужных биопсий в области рак груди. Будущие исследования будут фокусироваться на уточнении моделей и их примен

Abstract

To develop and externally validate integrated ultrasound nomograms combining BIRADS features and quantitative morphometric characteristics, and to compare their performance with expert radiologists and state of the art large language models in biopsy recommendation and malignancy prediction for breast lesions. In this retrospective multicenter, multinational study, 1747 women with pathologically confirmed breast lesions underwent ultrasound across three centers in Iran and Turkey. A total of 10 BIRADS and 26 morphological features were extracted from each lesion. A BIRADS, morphometric, and fused nomogram integrating both feature sets was constructed via logistic regression. Three radiologists (one senior, two general) and two ChatGPT variants independently interpreted deidentified breast lesion images. Diagnostic performance for biopsy recommendation (BIRADS 4,5) and malignancy prediction was assessed in internal and two external validation cohorts. In pooled analysis, the fused nomogram achieved the highest accuracy for biopsy recommendation (83.0%) and malignancy prediction (83.8%), outperforming the morphometric nomogram, three radiologists and both ChatGPT models. Its AUCs were 0.901 and 0.853 for the two tasks, respectively. In addition, the performance of the BIRADS nomogram was significantly higher than the morphometric nomogram, three radiologists and both ChatGPT models for biopsy recommendation and malignancy prediction. External validation confirmed the robust generalizability across different ultrasound platforms and populations. An integrated BIRADS morphometric nomogram consistently outperforms standalone models, LLMs, and radiologists in guiding biopsy decisions and predicting malignancy. These interpretable, externally validated tools have the potential to reduce unnecessary biopsies and enhance personalized decision making in breast imaging.

Ссылки и действия