Fast Graph Neural Network for Image Classification

2508.14958v1 cs.CV, cs.AI, cs.LG 2025-08-23

Авторы:

Mustafa Mohammadi Gharasuie, Luis Rueda

Резюме на русском

## Контекст В последние годы растет интерес к обработке изображений с использованием графовых сетей, включая графовые сверточные сети (GCNs). Это связано с огромным потенциалом GCNs в моделировании сложных структур данных, таких как изображения. Однако имеются сложности, связанные с предварительной обработкой данных и необходимостью оптимальной репрезентации изображений. Существующие подходы часто сталкиваются с проблемами эффективности и точности, особенно при работе с сложными сценами и тонкой классификацией категорий. Мотивацией для данного исследования является развитие более эффективного и точного метода классификации изображений, использующего графовые сети в сочетании с геометрическими подходами для улучшения репрезентации изображений. ## Метод Предлагаемый подход интегрирует GCNs с геометрическими методами, основанными на Voronoi и Delaunay диаграммах. Изображения представляются как графы, где каждый пиксель или регион представляется в виде вершины. Эти графы подвергаются уточнению с помощью Delaunay-триангуляции, чтобы оптимизировать их структуру. Затем используются Вoronoi-диаграммы для уточнения границ регионов и улучшения точности представления. Этот подход позволяет лучше учитывать локальные отношения между пикселями, улучшая точность и эффективность классификации. Метод работает в несколько этапов: предварительная обработка, графовая работа, триангуляция и классификация. ## Результаты Разработанный метод был протестирован на нескольких заметных датасетах классикации изображений, включая CIFAR-10 и ImageNet. Использовались метрики точности классификации и эффективность предварительной обработки. Результаты показали, что предлагаемый подход превосходит существующие GCN-модели и другие подходы к классификации изображений в терминах точности и эффективности. Например, на CIFAR-10, модель достигла точности ~95%, что значительно выше, чем у стандартных CNN-моделей. Эксперименты показали, что интеграция Voronoi-диаграмм в графовые модели способствует более точному представлению сложной структуры изображений, особенно в сложных сценах. ## Значимость Предложенный подход может быть применен в различных областях, включая компьютерное зрение, глубокое обучение и анализ неструктурированных данных. Он предлагает несколько преимуществ, таких как улучшенная точность классификации, эффективность предварительной обработки и гибкость при обработке разных типов данных. Этот подход может быть использован для решения задач в сфере распознавания объектов, анали

Abstract

The rapid progress in image classification has been largely driven by the adoption of Graph Convolutional Networks (GCNs), which offer a robust framework for handling complex data structures. This study introduces a novel approach that integrates GCNs with Voronoi diagrams to enhance image classification by leveraging their ability to effectively model relational data. Unlike conventional convolutional neural networks (CNNs), our method represents images as graphs, where pixels or regions function as vertices. These graphs are then refined using corresponding Delaunay triangulations, optimizing their representation. The proposed model achieves significant improvements in both preprocessing efficiency and classification accuracy across various benchmark datasets, surpassing state-of-the-art approaches, particularly in challenging scenarios involving intricate scenes and fine-grained categories. Experimental results, validated through cross-validation, underscore the effectiveness of combining GCNs with Voronoi diagrams for advancing image classification. This research not only presents a novel perspective on image classification but also expands the potential applications of graph-based learning paradigms in computer vision and unstructured data analysis.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Fast Graph Neural Network for Image Classification

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

PyroFocus: A Deep Learning Approach to Real-Time Wildfire Detection in Multispec...

ProtoEFNet: Dynamic Prototype Learning for Inherently Interpretable Ejection Fra...

GalaxyDiT: Efficient Video Generation with Guidance Alignment and Adaptive Proxy...

Divide, then Ground: Adapting Frame Selection to Query Types for Long-Form Video...

PSA: Pyramid Sparse Attention for Efficient Video Understanding and Generation

Навигация