Accelerating Image Classification with Graph Convolutional Neural Networks using Voronoi Diagrams

2508.14218v1 cs.CV, cs.LG 2025-08-22
Авторы:

Mustafa Mohammadi Gharasuie, Luis Rueda

Резюме на русском

#### Контекст Изображения широко используются в различных областях, таких как медицина, спутниковая съемка, интернет-реклама и транспортная система. Однако анализ изображений часто требует высокого вычислительного билета, что затрудняет реализацию эвристических алгоритмов и затрату времени на моделирование. Одним из ключевых аспектов в обработке изображений является классификация изображений. Она заключается в присвоении каждого изображения определенного класса на основе его контента. Одним из самых популярных подходов к решению этой задачи является использование сверточных нейронных сетей (CNN). Однако, несмотря на их высокую точность, CNN расходятся в вычислительных ресурсах и могут сталкиваться с проблемами доступности в некоторых сценариях. Недавние развития в области графовых нейронных сетей (GCNs) предложили новый подход к обработке графовых данных. Наша исследовательская группа решила использовать GCNs для работы с изображениями, объединив их с диаграммами Вороного, чтобы улучшить эффективность процесса классификации. Этот подход позволяет лучше описывать изображения в терминах графов, чтобы улучшить скорость обработки и точность классификации. #### Метод Мы предлагаем новую модель, называемую Нормализованной Вороного Графовой Сверточной Сетью (NVGCN). Эта модель использует диаграмму Вороного для представления изображений в виде графов. На входе NVGCN получает изображение, преобразованное в граф, где пиксели или регионы представлены вершинами графа. Затем граф упрощается с помощью Delaunay-триангуляции, чтобы создать более простой представления. NVGCN использует нормализованное взвешивание для вычисления весов узлов в графе, чтобы повысить точность классификации и сократить время вычислений. Этот подход имеет дополнительные преимущества по сравнению с существующими моделями CNN, так как он может быстрее обрабатывать сложные сцены и типы классов. #### Результаты Мы проверили нашу модель на нескольких задачах классификации изображений, в том числе CIFAR-10, CIFAR-100, и ImageNet. Для сравнения, мы использовали стандартные показатели точности классификации и времени работы. Наши результаты показали, что NVGCN превосходит CNN в точности классификации, особенно в сложных сценариях и задачах классификации сетчатых данных. Благодаря использованию диаграмм Вороного, NVGCN может быстрее выполнять графовые операции, что улучшает время обучения и классификации. Например, в задаче классификации ImageNet NVGCN показала значительное улучшение в скорости классификации, относительно CNN, без потери

Abstract

Recent advances in image classification have been significantly propelled by the integration of Graph Convolutional Networks (GCNs), offering a novel paradigm for handling complex data structures. This study introduces an innovative framework that employs GCNs in conjunction with Voronoi diagrams to peform image classification, leveraging their exceptional capability to model relational data. Unlike conventional convolutional neural networks, our approach utilizes a graph-based representation of images, where pixels or regions are treated as vertices of a graph, which are then simplified in the form of the corresponding Delaunay triangulations. Our model yields significant improvement in pre-processing time and classification accuracy on several benchmark datasets, surpassing existing state-of-the-art models, especially in scenarios that involve complex scenes and fine-grained categories. The experimental results, validated via cross-validation, underscore the potential of integrating GCNs with Voronoi diagrams in advancing image classification tasks. This research contributes to the field by introducing a novel approach to image classification, while opening new avenues for developing graph-based learning paradigms in other domains of computer vision and non-structured data. In particular, we have proposed a new version of the GCN in this paper, namely normalized Voronoi Graph Convolution Network (NVGCN), which is faster than the regular GCN.

Ссылки и действия