ERDES: A Benchmark Video Dataset for Retinal Detachment and Macular Status Classification in Ocular Ultrasound
2508.04735v1
q-bio.QM, cs.AI
2025-08-09
Авторы:
Pouyan Navard, Yasemin Ozkut, Srikar Adhikari, Elaine Situ-LaCasse, Josie Acuña, Adrienne Yarnish, Alper Yilmaz
Резюме на русском
## КОНТЕКСТ И ПРОБЛЕМАТИКА
Ретинальный детачмент (РД) является одной из серьезных угроз зрения, требующей немедленного вмешательства для сохранения зрительной функции. Ключевым фактором, определяющим визуальные показатели и срочность лечения, является состояние макулы — ее сохранность (макула-интакт) или отсутствие (макула-детачд). Диагностика РД часто осуществляется с помощью точки-обслуживания ультразвукового сканирования (POCUS), который является быстрым, неинвасивным, доступным и экономически эффективным методом. Однако его эффективность зависит от квалификации медицинских работников, что часто является проблемой, особенно в ресурсно-ограниченных условиях.
В последнее время глубокое обучение (Deep Learning) открыло новые возможности для автоматизации оценки ультразвуковых изображений. Однако, несмотря на широкий потенциал, в настоящее время не существует медицинских приложений на основе машинного обучения (ML) для диагностики РД на основе ультразвука, а также для оценки состояния макулы в случае РД. Это ограничение является критичным, поскольку оценка состояния макулы является важным фактором для определения приоритетов в хирургическом лечении. Кроме того, по сей день не существует открытого датасета, позволяющего классифицировать РД на основе ультразвуковых видеоклипов с учетом состояния макулы.
В связи с этим был разработан Eye Retinal DEtachment ultraSound (ERDES) — первый открытый датасет ультразвуковых клипов, отмеченных для диагностики РД и определения состояния макулы (макула-интакт или макула-детачд). Этот датасет предназначен для разработки и оценки моделей машинного обучения, позволяющих автоматизировать процесс диагностики РД. Для обеспечения начальных результатов, авторы также предоставили бенчмарки на основе нескольких спатио-временных конволюционных нейронных сетей (CNN). Весь датасет, включая видеоклипов, отмеченные данные и код для тренировки, доступен на сайте https://osupcvlab.github.io/ERDES/.
## ПРЕДЛОЖЕННЫЙ МЕТОД
Методология, предложенная в статье, основывается на использовании спатио-временных конволюционных нейронных сетей (CNN) для классификации ультразвуковых видеоклипов по наличию ретинального детачмента и состоянию макулы. Для этого был создан датасет ERDES, содержащий ультразвуковые видеоклипов, аннотированных по двум категориям: наличие ретинального детачмента и состояние макулы (макула-интакт или макула-детачд).
Архитектура CNN использует спатио-временные свертки для анализа пространственных и временных признаков в ультразвуковых видеоклипов. Это позволяет модели обнаруживать и классифицировать характеристики, связанные с ретинальным детачментом и состоянием макулы. Авторы также предоставили базовые бенчмарки, используя различные архитектуры CNN, чтобы демонстрировать возможности датасета и показать его потенциал для дальнейшего исследования.
## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ
В рамках исследования были проведены эксперименты для оценки эффективности датасета ERDES и базовых моделей CNN. Для экспериментов использовались ультразвуковые клипов из датасета, которые были размечены по наличию ретинального детачмента и состоянию макулы. Результаты показали, что использование спатио-временных CNN позволяет достичь высокой точности в классификации РД и определении состояния макулы.
Кроме того, были проанализированы различные CNN-архитектуры, чтобы определить лучшую модель для данной задачи. Результаты экспериментов показали, что некоторые модели демонстрируют высокую точность и надежность в классификации, что демонстрирует потенциал датасета ERDES для разработки эффективных моделей машинного обучения в этой области.
## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ
Предложенный датасет ERDES имеет значительное практическое значение для медицинского сообщества. Он позволяет разработать и опробовать модели машинного обучения для автоматической диагностики ретинального детачмента и определения состояния макулы, что может существенно улучшить качество и скорость диагностики в клинической практике. Это особенно важно в ресурсно-ограниченных условиях, где квалифицированных специалистов часто не хватает для точной интерпретации ультразвуковых изображений.
Датасет также открывает новые возможности для исследования и разработки новых методов диагностики на основе ультразвука, что может привести к новым технологическим решениям в области офтальмологии.
## ВЫВОДЫ И ПЕРСПЕКТИВЫ
В рамках данного исследования был представлен первый открытый датасет ERDES для диагностики ретинального детачмента и оценки состояния макулы на основе ультразвуковых видеоклипов. Результаты показали высокий потенциал этого датасета для разработки моделей машинного обучения, которые могут автоматизировать процесс диагностики.
В будущем предлагается продолжить исследования в этой области, включая разработку более точных моделей CNN, адаптированных к ультразвуковым данным, а также исследование других моделей машинного обучения, которые могут быть использованы для этой задачи. Также важно продолжить работу над расширением датасета ERDES и его применением в реальных клинических условиях для дальнейшего улучшения диагностики и лечения ретинального детачмента.
Abstract
Retinal detachment (RD) is a vision-threatening condition that requires
timely intervention to preserve vision. Macular involvement -- whether the
macula is still intact (macula-intact) or detached (macula-detached) -- is the
key determinant of visual outcomes and treatment urgency. Point-of-care
ultrasound (POCUS) offers a fast, non-invasive, cost-effective, and accessible
imaging modality widely used in diverse clinical settings to detect RD.
However, ultrasound image interpretation is limited by a lack of expertise
among healthcare providers, especially in resource-limited settings. Deep
learning offers the potential to automate ultrasound-based assessment of RD.
However, there are no ML ultrasound algorithms currently available for clinical
use to detect RD and no prior research has been done on assessing macular
status using ultrasound in RD cases -- an essential distinction for surgical
prioritization. Moreover, no public dataset currently supports macular-based RD
classification using ultrasound video clips. We introduce Eye Retinal
DEtachment ultraSound, ERDES, the first open-access dataset of ocular
ultrasound clips labeled for (i) presence of retinal detachment and (ii)
macula-intact versus macula-detached status. The dataset is intended to
facilitate the development and evaluation of machine learning models for
detecting retinal detachment. We also provide baseline benchmarks using
multiple spatiotemporal convolutional neural network (CNN) architectures. All
clips, labels, and training code are publicly available at
https://osupcvlab.github.io/ERDES/.
Ссылки и действия
Дополнительные ресурсы: