Hybrid Quantum-Classical Model for Image Classification

2509.13353v1 cs.CV, cs.AI, cs.LG 2025-09-19
Авторы:

Muhammad Adnan Shahzad

Резюме на русском

#### Контекст Классические нейронные сети, такие как конвельционные (CNN), широко используются для задач классификации изображений. Однако они могут сталкиваться с ограничениями в скорости обучения, эффективности использования ресурсов и устойчивости к атакам. За последние годы, квантовые вычисления набирают популярность в области развития моделей, которые могут превосходить классические в плане производительности и устойчивости. Одна из целей этого исследования — оценить потенциал использования гибридных квантово-классических моделей для классификации изображений и сравнить их с классическими моделями на трех различных выборках данных. #### Метод Гибридные модели, рассматриваемые в данном исследовании, объединяют параметризованные квантовые вычисления с классическими сетями. На вход подается изображение, которое обрабатывается в классической CNN нейросети, а затем, для улучшения устойчивости и точности, обрабатывается в параметризованном квантовом слое. Алгоритмы обучения были запущены на 50 эпох для каждой из выборок (MNIST, CIFAR100 и STL10). Эксперименты включали оценку валидационной и тестовой точности, времени обучения, использования ресурсов и робастности к атакам. #### Результаты На выборке MNIST, гибридная модель достигла точности в 99.38% при валидации и 98.45% на тесте. На CIFAR100, гибридная модель превышала классические результаты на 9.44%, достигнув 41.69%, а на STL10 — 74.05%, что является выигрышем на 10.29% по сравнению с классическими моделями. Затраты на обучение гибридных моделей составили 5–12 раз меньше, чем для классических, а модели также потребляли 6–32% меньше памяти. Анализ устойчивости к атакам показал, что на MNIST, гибридные модели показали 45.27% устойчивости, в то время как классические модели показали 10.80%. На CIFAR100, обе модели показали очень низкую устойчивость. #### Значимость Гибридные квантово-классические модели демонстрируют выигрыш в точности и эффективности, особенно на более сложных задачах классификации. Они находятся в центре внимания в развитии методов классификации, где необходима высокая точность, низкая затрата ресурсов и устойчивость к атакам. Эти модели могут быть применены в сферах, где ресурсы дорогостоящи, и требуется быстрая обработка данных. #### Выводы Гибридные модели показали преимущества в производительности, эффективности использования ресурсов и устойчивости к атакам на менее сложных задачах. Однако на более сложных выборках, таких как CIFAR100, эти преимущества становятся менее заметны. Будущие исс

Abstract

This study presents a systematic comparison between hybrid quantum-classical neural networks and purely classical models across three benchmark datasets (MNIST, CIFAR100, and STL10) to evaluate their performance, efficiency, and robustness. The hybrid models integrate parameterized quantum circuits with classical deep learning architectures, while the classical counterparts use conventional convolutional neural networks (CNNs). Experiments were conducted over 50 training epochs for each dataset, with evaluations on validation accuracy, test accuracy, training time, computational resource usage, and adversarial robustness (tested with $\epsilon=0.1$ perturbations).Key findings demonstrate that hybrid models consistently outperform classical models in final accuracy, achieving {99.38\% (MNIST), 41.69\% (CIFAR100), and 74.05\% (STL10) validation accuracy, compared to classical benchmarks of 98.21\%, 32.25\%, and 63.76\%, respectively. Notably, the hybrid advantage scales with dataset complexity, showing the most significant gains on CIFAR100 (+9.44\%) and STL10 (+10.29\%). Hybrid models also train 5--12$\times$ faster (e.g., 21.23s vs. 108.44s per epoch on MNIST) and use 6--32\% fewer parameters} while maintaining superior generalization to unseen test data.Adversarial robustness tests reveal that hybrid models are significantly more resilient on simpler datasets (e.g., 45.27\% robust accuracy on MNIST vs. 10.80\% for classical) but show comparable fragility on complex datasets like CIFAR100 ($\sim$1\% robustness for both). Resource efficiency analyses indicate that hybrid models consume less memory (4--5GB vs. 5--6GB for classical) and lower CPU utilization (9.5\% vs. 23.2\% on average).These results suggest that hybrid quantum-classical architectures offer compelling advantages in accuracy, training efficiency, and parameter scalability, particularly for complex vision tasks.

Ссылки и действия