Ultrasound-based detection and malignancy prediction of breast lesions eligible for biopsy: A multi-center clinical-scenario study using nomograms, large language models, and radiologist evaluation
2509.00946v1
eess.IV, cs.CV
2025-09-05
Авторы:
Ali Abbasian Ardakani, Afshin Mohammadi, Taha Yusuf Kuzan, Beyza Nur Kuzan, Hamid Khorshidi, Ashkan Ghorbani, Alisa Mohebbi, Fariborz Faeghi, Sepideh Hatamikia, U Rajendra Acharya
Резюме на русском
#### Контекст
Оценка лимфомы и её классификация в области онкологии и радиологии является ключевым аспектом диагностики и терапии. Несмотря на развитие изобразительных методов, повышение точности диагноза и предсказания клинических результатов остается вызовом. Особенностью заболеваний лимфомы является их широкий спектр клинических проявлений и разнообразие биологических свойств, что затрудняет объединение подходов к диагностике. Необходимость в развитии методов, объединяющих клинические, иммунологические и индивидуальные медицинские данные, является мотивацией для этого исследования.
#### Метод
Исследование основывается на многоцентровой коллекции пациентов с утвержденными патологическими выявлениями лимфомы. Использовались данные по 1747 женщинам с биопсийно подтвержденными подозрениями на рак груди. Для каждой железы извлечены 10 BIRADS-признаков и 26 морфометрических характеристик. Номинаторы, включающие эти признаки, построены с помощью логистической регрессии. Дополнительно, дезидентифицированные изображения желез разделены на тренировочную и валидационную выборку. Проведены сравнительные эксперименты с использованием статистических моделей, моделей машинного обучения и оценки трёх радиологов (один старший, два общих).
#### Результаты
В целом, статистическая модель, объединяющая BIRADS и морфометрические признаки, показала наивысшую точность в рекомендации биопсии (83.0%) и предсказании мальиности (83.8%). Эта модель превзошла отдельные модели (BIRADS и морфометрические), трёх радиологов и двух моделей текстовых генераторов (ChatGPT). Внешняя валидация показала высокую общую ценность и генерализуемость модели в разных ультразвуковых системах и демографических группах.
#### Значимость
Результаты имеют перспективу для улучшения клинических решений в области рак груди. Интегрированные BIRADS-морфометрические номинаторы предлагают интерпретируемый инструмент для уменьшения числа ненужных биопсий и повышения точности классификации. Инновационные подходы, основанные на глубоком обучении и номинации, могут способствовать более персонализированной и эффективной медицинской практике.
#### Выводы
Интегрированные BIRADS-морфометрические номинаторы доказали свою превосходность по сравнению с отдельными моделями и экспертной оценкой. Они обеспечивают перспективу для повышения точности диагноза и понижения риска ненужных биопсий в области рак груди. Будущие исследования будут фокусироваться на уточнении моделей и их примен
Abstract
To develop and externally validate integrated ultrasound nomograms combining
BIRADS features and quantitative morphometric characteristics, and to compare
their performance with expert radiologists and state of the art large language
models in biopsy recommendation and malignancy prediction for breast lesions.
In this retrospective multicenter, multinational study, 1747 women with
pathologically confirmed breast lesions underwent ultrasound across three
centers in Iran and Turkey. A total of 10 BIRADS and 26 morphological features
were extracted from each lesion. A BIRADS, morphometric, and fused nomogram
integrating both feature sets was constructed via logistic regression. Three
radiologists (one senior, two general) and two ChatGPT variants independently
interpreted deidentified breast lesion images. Diagnostic performance for
biopsy recommendation (BIRADS 4,5) and malignancy prediction was assessed in
internal and two external validation cohorts. In pooled analysis, the fused
nomogram achieved the highest accuracy for biopsy recommendation (83.0%) and
malignancy prediction (83.8%), outperforming the morphometric nomogram, three
radiologists and both ChatGPT models. Its AUCs were 0.901 and 0.853 for the two
tasks, respectively. In addition, the performance of the BIRADS nomogram was
significantly higher than the morphometric nomogram, three radiologists and
both ChatGPT models for biopsy recommendation and malignancy prediction.
External validation confirmed the robust generalizability across different
ultrasound platforms and populations. An integrated BIRADS morphometric
nomogram consistently outperforms standalone models, LLMs, and radiologists in
guiding biopsy decisions and predicting malignancy. These interpretable,
externally validated tools have the potential to reduce unnecessary biopsies
and enhance personalized decision making in breast imaging.
Ссылки и действия
Дополнительные ресурсы: