Development of a Neural Network Model for Currency Detection to aid visually impaired people in Nigeria

2508.18012v1 cs.CV, cs.LG 2025-08-27
Авторы:

Sochukwuma Nwokoye, Desmond Moru

Резюме на русском

## Контекст В настоящее время, глобально около 2,2 миллиарда людей страдают различными формами визуальных нарушений. Для них пространственное восприятие остается основной проблемой, ограничивающей их способность взаимодействовать с окружающим миром. Эта ситуация является критической, особенно в странах с развивающимся экономикой, где социальная интеграция и полноценное участие в жизни общества требуют дополнительных мер поддержки. Одна из наиболее трудных задач для инвалидов зрения является ориентация в пространстве и выявление объектов. Например, выявление и различение купюр является важной задачей для независимого обращения на рынке. Существующие решения, такие как термопринтеры или устройства с экономическими счетчиками, зачастую оказываются недостаточно эффективными, так как не поддерживают все формы валюты и могут быть дорогостоящими для многих пользователей. В этом контексте исследование рассматривает потенциал искусственных нейронных сетей для определения валюты в реальном времени, с целью сделать жизнь инвалидов зрения проще и более удобной. ## Метод Для этого исследования была применена сверточная сеть с глубиной 19 слоев (SSD, Single Shot Multibox Detector), которая широко используется в зоне распознавания объектов на изображениях. Изначально была собрана пользовательская выборка содержащая 3 468 изображений, включающих различные валюты, такие как 200 Нигерийских Нира (₦200), 500 ₦ и 1000 ₦. Изображения были запечатлены в разных условиях света, чтобы повысить общую надёжность сети. Для обучения сети была использована алгоритмическая модификация сверточных сетей с глубиной 19 слоев, которая призвана улучшить достоверность распознавания. Для эффективного обработки изображений и их превращения в видеопоток, алгоритм работал на устройстве с графическим процессором NVIDIA Tesla K80, что обеспечивало необходимую производительность для реального времени. ## Результаты Проведенные эксперименты показали, что система обладает высокой точностью распознавания. Средняя точность (Mean Average Precision) составила 91,2% при распознавании 200 ₦ и 93,4% при распознавании ₦500 и ₦1000. Эти результаты были получены в реальном времени с задержкой в 30 миллисекунд, что делает систему пригодной для практического применения. Кроме того, система была протестирована на разных уровнях освещённости и углов обзора, что подтвердило её устойчивость к различным условиям окружения. ## Значимость Важность данного исследования заключается в возможности повысить независимость инвалидов зрения в повседневных д

Abstract

Neural networks in assistive technology for visually impaired leverage artificial intelligence's capacity to recognize patterns in complex data. They are used for converting visual data into auditory or tactile representations, helping the visually impaired understand their surroundings. The primary aim of this research is to explore the potential of artificial neural networks to facilitate the differentiation of various forms of cash for individuals with visual impairments. In this study, we built a custom dataset of 3,468 images, which was subsequently used to train an SSD neural network model. The proposed system can accurately identify Nigerian cash, thereby streamlining commercial transactions. The performance of the system in terms of accuracy was assessed, and the Mean Average Precision score was over 90%. We believe that our system has the potential to make a substantial contribution to the field of assistive technology while also improving the quality of life of visually challenged persons in Nigeria and beyond.

Ссылки и действия