Automated Cervical Cancer Detection through Visual Inspection with Acetic Acid in Resource-Poor Settings with Lightweight Deep Learning Models Deployed on an Android Device

2508.13253v1 eess.IV, cs.CV, cs.LG, 68T07, 92C55, 68T45, I.4.9; J.3; I.2.10; I.2.6 2025-08-21
Авторы:

Leander Melroy Maben, Keerthana Prasad, Shyamala Guruvare, Vidya Kudva, P C Siddalingaswamy

Резюме на русском

#### Контекст Кожный рак является одной из самых распространенных форм рака в женской популяции и приводит к большому числу заболеваний и смертей в низкоингредиентных и среднеингредиентных странах, несмотря на то, что имеет предсказуемую и достаточно простую терапию. Опытные исследования показали, что профилактические меры, включающие в себя публичные скрининговые программы, могут значительно снизить частоту и поводы для смерти от кожного рака. Несмотря на доступность различных тестов, визуальная инспекция с применением якорного кислота (VIA) является наиболее бюджетным и простым в применении в средствах борьбы с раком в низкоингредиентных регионах. VIA требует вмешательства квалифицированного медиком и является подлежащим субъективному осмотру. Автоматизация VIA с помощью искусственного интеллекта может устранить эту субъективность и позволить расширить применение скрининга менее квалифицированным медицинским работникам. В настоящей работе описывается легковесное нейросетевое решение, которое использует EfficientDet-Lite3 для обнаружения регионов интереса (ROI) и модель MobileNet-V2 для классификации, включенных в систему, работающую на андроид-устройстве. Эта система предназначена для эксплуатации в удаленных областях и предоставляет результаты в режиме реального времени, не требуя высококвалифицированных специалистов, специальных лабораторий или высокоскоростного интернета. #### Метод Авторы предлагают сочетание двух нейросетевых моделей, работающих вместе для решения задачи автоматизации VIA. EfficientDet-Lite3 используется для выделения регионов интереса (ROI) на изображениях, полученных в ходе процедуры VIA. Для классификации этих регионов используется модель MobileNet-V2, обученная на многочисленных примерах, которая определяет присутствие раковых симптомов. Архитектура системы разработана с учетом требований низкоингредиентных регионов, чтобы обеспечить быструю и эффективную обработку на устройствах с ограниченными ресурсами. Для обучения и оценки модели использовались данные, собранные в ходе скрининговых программ VIA. Эксперименты проводились на наборе данных, включающем изображения с различными уровнями сложности и различными степенями выраженности раковых заболеваний. #### Результаты На тестовом наборе данных модель демонстрирует высокую точность (92.31%), высокую чувствительность (98.24%) и специфичность (88.37%). Эти показатели подтверждают то, что система может применяться в удаленных медицинских услугах, не требуя высококвалифицированных специалистов. Кроме того, модель работает быстро, что позволяет использовать е

Abstract

Cervical cancer is among the most commonly occurring cancer among women and claims a huge number of lives in low and middle-income countries despite being relatively easy to treat. Several studies have shown that public screening programs can bring down cervical cancer incidence and mortality rates significantly. While several screening tests are available, visual inspection with acetic acid (VIA) presents itself as the most viable option for low-resource settings due to the affordability and simplicity of performing the test. VIA requires a trained medical professional to interpret the test and is subjective in nature. Automating VIA using AI eliminates subjectivity and would allow shifting of the task to less trained health workers. Task shifting with AI would help further expedite screening programs in low-resource settings. In our work, we propose a lightweight deep learning algorithm that includes EfficientDet-Lite3 as the Region of Interest (ROI) detector and a MobileNet- V2 based model for classification. These models would be deployed on an android-based device that can operate remotely and provide almost instant results without the requirement of highly-trained medical professionals, labs, sophisticated infrastructure, or internet connectivity. The classification model gives an accuracy of 92.31%, a sensitivity of 98.24%, and a specificity of 88.37% on the test dataset and presents itself as a promising automated low-resource screening approach.

Ссылки и действия