Fast Graph Neural Network for Image Classification
2508.14958v1
cs.CV, cs.AI, cs.LG
2025-08-23
Авторы:
Mustafa Mohammadi Gharasuie, Luis Rueda
Резюме на русском
## Контекст
В последние годы растет интерес к обработке изображений с использованием графовых сетей, включая графовые сверточные сети (GCNs). Это связано с огромным потенциалом GCNs в моделировании сложных структур данных, таких как изображения. Однако имеются сложности, связанные с предварительной обработкой данных и необходимостью оптимальной репрезентации изображений. Существующие подходы часто сталкиваются с проблемами эффективности и точности, особенно при работе с сложными сценами и тонкой классификацией категорий. Мотивацией для данного исследования является развитие более эффективного и точного метода классификации изображений, использующего графовые сети в сочетании с геометрическими подходами для улучшения репрезентации изображений.
## Метод
Предлагаемый подход интегрирует GCNs с геометрическими методами, основанными на Voronoi и Delaunay диаграммах. Изображения представляются как графы, где каждый пиксель или регион представляется в виде вершины. Эти графы подвергаются уточнению с помощью Delaunay-триангуляции, чтобы оптимизировать их структуру. Затем используются Вoronoi-диаграммы для уточнения границ регионов и улучшения точности представления. Этот подход позволяет лучше учитывать локальные отношения между пикселями, улучшая точность и эффективность классификации. Метод работает в несколько этапов: предварительная обработка, графовая работа, триангуляция и классификация.
## Результаты
Разработанный метод был протестирован на нескольких заметных датасетах классикации изображений, включая CIFAR-10 и ImageNet. Использовались метрики точности классификации и эффективность предварительной обработки. Результаты показали, что предлагаемый подход превосходит существующие GCN-модели и другие подходы к классификации изображений в терминах точности и эффективности. Например, на CIFAR-10, модель достигла точности ~95%, что значительно выше, чем у стандартных CNN-моделей. Эксперименты показали, что интеграция Voronoi-диаграмм в графовые модели способствует более точному представлению сложной структуры изображений, особенно в сложных сценах.
## Значимость
Предложенный подход может быть применен в различных областях, включая компьютерное зрение, глубокое обучение и анализ неструктурированных данных. Он предлагает несколько преимуществ, таких как улучшенная точность классификации, эффективность предварительной обработки и гибкость при обработке разных типов данных. Этот подход может быть использован для решения задач в сфере распознавания объектов, анали
Abstract
The rapid progress in image classification has been largely driven by the
adoption of Graph Convolutional Networks (GCNs), which offer a robust framework
for handling complex data structures. This study introduces a novel approach
that integrates GCNs with Voronoi diagrams to enhance image classification by
leveraging their ability to effectively model relational data. Unlike
conventional convolutional neural networks (CNNs), our method represents images
as graphs, where pixels or regions function as vertices. These graphs are then
refined using corresponding Delaunay triangulations, optimizing their
representation. The proposed model achieves significant improvements in both
preprocessing efficiency and classification accuracy across various benchmark
datasets, surpassing state-of-the-art approaches, particularly in challenging
scenarios involving intricate scenes and fine-grained categories. Experimental
results, validated through cross-validation, underscore the effectiveness of
combining GCNs with Voronoi diagrams for advancing image classification. This
research not only presents a novel perspective on image classification but also
expands the potential applications of graph-based learning paradigms in
computer vision and unstructured data analysis.
Ссылки и действия
Дополнительные ресурсы: