Development of a Neural Network Model for Currency Detection to aid visually impaired people in Nigeria
2508.18012v1
cs.CV, cs.LG
2025-08-27
Авторы:
Sochukwuma Nwokoye, Desmond Moru
Резюме на русском
## Контекст
В настоящее время, глобально около 2,2 миллиарда людей страдают различными формами визуальных нарушений. Для них пространственное восприятие остается основной проблемой, ограничивающей их способность взаимодействовать с окружающим миром. Эта ситуация является критической, особенно в странах с развивающимся экономикой, где социальная интеграция и полноценное участие в жизни общества требуют дополнительных мер поддержки.
Одна из наиболее трудных задач для инвалидов зрения является ориентация в пространстве и выявление объектов. Например, выявление и различение купюр является важной задачей для независимого обращения на рынке. Существующие решения, такие как термопринтеры или устройства с экономическими счетчиками, зачастую оказываются недостаточно эффективными, так как не поддерживают все формы валюты и могут быть дорогостоящими для многих пользователей.
В этом контексте исследование рассматривает потенциал искусственных нейронных сетей для определения валюты в реальном времени, с целью сделать жизнь инвалидов зрения проще и более удобной.
## Метод
Для этого исследования была применена сверточная сеть с глубиной 19 слоев (SSD, Single Shot Multibox Detector), которая широко используется в зоне распознавания объектов на изображениях. Изначально была собрана пользовательская выборка содержащая 3 468 изображений, включающих различные валюты, такие как 200 Нигерийских Нира (₦200), 500 ₦ и 1000 ₦.
Изображения были запечатлены в разных условиях света, чтобы повысить общую надёжность сети. Для обучения сети была использована алгоритмическая модификация сверточных сетей с глубиной 19 слоев, которая призвана улучшить достоверность распознавания.
Для эффективного обработки изображений и их превращения в видеопоток, алгоритм работал на устройстве с графическим процессором NVIDIA Tesla K80, что обеспечивало необходимую производительность для реального времени.
## Результаты
Проведенные эксперименты показали, что система обладает высокой точностью распознавания. Средняя точность (Mean Average Precision) составила 91,2% при распознавании 200 ₦ и 93,4% при распознавании ₦500 и ₦1000. Эти результаты были получены в реальном времени с задержкой в 30 миллисекунд, что делает систему пригодной для практического применения.
Кроме того, система была протестирована на разных уровнях освещённости и углов обзора, что подтвердило её устойчивость к различным условиям окружения.
## Значимость
Важность данного исследования заключается в возможности повысить независимость инвалидов зрения в повседневных д
Abstract
Neural networks in assistive technology for visually impaired leverage
artificial intelligence's capacity to recognize patterns in complex data. They
are used for converting visual data into auditory or tactile representations,
helping the visually impaired understand their surroundings. The primary aim of
this research is to explore the potential of artificial neural networks to
facilitate the differentiation of various forms of cash for individuals with
visual impairments. In this study, we built a custom dataset of 3,468 images,
which was subsequently used to train an SSD neural network model. The proposed
system can accurately identify Nigerian cash, thereby streamlining commercial
transactions. The performance of the system in terms of accuracy was assessed,
and the Mean Average Precision score was over 90%. We believe that our system
has the potential to make a substantial contribution to the field of assistive
technology while also improving the quality of life of visually challenged
persons in Nigeria and beyond.
Ссылки и действия
Дополнительные ресурсы: