Scaling Artificial Intelligence for Prostate Cancer Detection on MRI towards Population-Based Screening and Primary Diagnosis in a Global, Multiethnic Population (Study Protocol)

2508.03762v1 eess.IV, cs.CV 2025-08-09
Авторы:

Anindo Saha, Joeran S. Bosma, Jasper J. Twilt, Alexander B. C. D. Ng, Aqua Asif, Kirti Magudia, Peder Larson, Qinglin Xie, Xiaodong Zhang, Chi Pham Minh, Samuel N. Gitau, Ivo G. Schoots, Martijn F. Boomsma, Renato Cuocolo, Nikolaos Papanikolaou, Daniele Regge, Derya Yakar, Mattijs Elschot, Jeroen Veltman, Baris Turkbey, Nancy A. Obuchowski, Jurgen J. Fütterer, Anwar R. Padhani, Hashim U. Ahmed, Tobias Nordström, Martin Eklund, Veeru Kasivisvanathan, Maarten de Rooij, Henkjan Huisman

Резюме на русском

**Резюме** В статье предлагается метод скалирования искусственного интеллекта (AI) для повышения точности диагностики простаты канцера (PCa) на MRI в рамках глобального многоэтнического исследования. Авторы развивают модель PI-CAI-2B, расширенную версию современной AI-системы, ранее созданной для обнаружения Gleason grade group ≥2 PCa на MRI. Исследование включает отбор данных из 22,481 MRI-исследований, полученных у 21,288 пациентов в 46 городах 22 стран. 20,471 случая используются для тренировки и внутреннего тестирования, а 2,010 случаев — для внешнего тестирования на масштабных программах скрининга (напр., STHLM3-MRI) и принципиальных диагностических назначениях (напр., PRIME). Основной критерий оценки — согласия с клиническими диагнозами, основанными на histopathology или оценках двух консультантов-урогенитальных радиологов. Авторы также проверяют уровни биазы в зависимости от качества имеджинга, возраста и этнического происхождения пациента. Ожидается, что данный подход способен стать оптимальным решением для эффективного AI-ориентированного скрининга PCa на масштабе мирового общества.

Abstract

In this intercontinental, confirmatory study, we include a retrospective cohort of 22,481 MRI examinations (21,288 patients; 46 cities in 22 countries) to train and externally validate the PI-CAI-2B model, i.e., an efficient, next-generation iteration of the state-of-the-art AI system that was developed for detecting Gleason grade group $\geq$2 prostate cancer on MRI during the PI-CAI study. Of these examinations, 20,471 cases (19,278 patients; 26 cities in 14 countries) from two EU Horizon projects (ProCAncer-I, COMFORT) and 12 independent centers based in Europe, North America, Asia and Africa, are used for training and internal testing. Additionally, 2010 cases (2010 patients; 20 external cities in 12 countries) from population-based screening (STHLM3-MRI, IP1-PROSTAGRAM trials) and primary diagnostic settings (PRIME trial) based in Europe, North and South Americas, Asia and Australia, are used for external testing. Primary endpoint is the proportion of AI-based assessments in agreement with the standard of care diagnoses (i.e., clinical assessments made by expert uropathologists on histopathology, if available, or at least two expert urogenital radiologists in consensus; with access to patient history and peer consultation) in the detection of Gleason grade group $\geq$2 prostate cancer within the external testing cohorts. Our statistical analysis plan is prespecified with a hypothesis of diagnostic interchangeability to the standard of care at the PI-RADS $\geq$3 (primary diagnosis) or $\geq$4 (screening) cut-off, considering an absolute margin of 0.05 and reader estimates derived from the PI-CAI observer study (62 radiologists reading 400 cases). Secondary measures comprise the area under the receiver operating characteristic curve (AUROC) of the AI system stratified by imaging quality, patient age and patient ethnicity to identify underlying biases (if any).

Ссылки и действия