Accelerating Image Classification with Graph Convolutional Neural Networks using Voronoi Diagrams
2508.14218v1
cs.CV, cs.LG
2025-08-22
Авторы:
Mustafa Mohammadi Gharasuie, Luis Rueda
Резюме на русском
#### Контекст
Изображения широко используются в различных областях, таких как медицина, спутниковая съемка, интернет-реклама и транспортная система. Однако анализ изображений часто требует высокого вычислительного билета, что затрудняет реализацию эвристических алгоритмов и затрату времени на моделирование. Одним из ключевых аспектов в обработке изображений является классификация изображений. Она заключается в присвоении каждого изображения определенного класса на основе его контента. Одним из самых популярных подходов к решению этой задачи является использование сверточных нейронных сетей (CNN). Однако, несмотря на их высокую точность, CNN расходятся в вычислительных ресурсах и могут сталкиваться с проблемами доступности в некоторых сценариях. Недавние развития в области графовых нейронных сетей (GCNs) предложили новый подход к обработке графовых данных. Наша исследовательская группа решила использовать GCNs для работы с изображениями, объединив их с диаграммами Вороного, чтобы улучшить эффективность процесса классификации. Этот подход позволяет лучше описывать изображения в терминах графов, чтобы улучшить скорость обработки и точность классификации.
#### Метод
Мы предлагаем новую модель, называемую Нормализованной Вороного Графовой Сверточной Сетью (NVGCN). Эта модель использует диаграмму Вороного для представления изображений в виде графов. На входе NVGCN получает изображение, преобразованное в граф, где пиксели или регионы представлены вершинами графа. Затем граф упрощается с помощью Delaunay-триангуляции, чтобы создать более простой представления. NVGCN использует нормализованное взвешивание для вычисления весов узлов в графе, чтобы повысить точность классификации и сократить время вычислений. Этот подход имеет дополнительные преимущества по сравнению с существующими моделями CNN, так как он может быстрее обрабатывать сложные сцены и типы классов.
#### Результаты
Мы проверили нашу модель на нескольких задачах классификации изображений, в том числе CIFAR-10, CIFAR-100, и ImageNet. Для сравнения, мы использовали стандартные показатели точности классификации и времени работы. Наши результаты показали, что NVGCN превосходит CNN в точности классификации, особенно в сложных сценариях и задачах классификации сетчатых данных. Благодаря использованию диаграмм Вороного, NVGCN может быстрее выполнять графовые операции, что улучшает время обучения и классификации. Например, в задаче классификации ImageNet NVGCN показала значительное улучшение в скорости классификации, относительно CNN, без потери
Abstract
Recent advances in image classification have been significantly propelled by
the integration of Graph Convolutional Networks (GCNs), offering a novel
paradigm for handling complex data structures. This study introduces an
innovative framework that employs GCNs in conjunction with Voronoi diagrams to
peform image classification, leveraging their exceptional capability to model
relational data. Unlike conventional convolutional neural networks, our
approach utilizes a graph-based representation of images, where pixels or
regions are treated as vertices of a graph, which are then simplified in the
form of the corresponding Delaunay triangulations. Our model yields significant
improvement in pre-processing time and classification accuracy on several
benchmark datasets, surpassing existing state-of-the-art models, especially in
scenarios that involve complex scenes and fine-grained categories. The
experimental results, validated via cross-validation, underscore the potential
of integrating GCNs with Voronoi diagrams in advancing image classification
tasks. This research contributes to the field by introducing a novel approach
to image classification, while opening new avenues for developing graph-based
learning paradigms in other domains of computer vision and non-structured data.
In particular, we have proposed a new version of the GCN in this paper, namely
normalized Voronoi Graph Convolution Network (NVGCN), which is faster than the
regular GCN.
Ссылки и действия
Дополнительные ресурсы: