Graph Your Own Prompt

2509.23373v1 cs.LG, cs.AI, cs.CV 2025-10-01

Авторы:

Xi Ding, Lei Wang, Piotr Koniusz, Yongsheng Gao

Резюме на русском

#### Контекст Глубокие нейронные сети достигли впечатляющих результатов в обработке и анализе изображений, текста, звука и других типов данных. Однако они часто сталкиваются с проблемой недостаточной семантической структуры в пространстве признаков. Например, они могут сопоставить не относящиеся друг к другу объекты, такие как "кошка" и "собака", в одном пространстве признаков, что приводит к нежелательным пересечениям между классами. Эта проблема становится важной, когда сети используются в задачах, требующих высокой точности или семантической классификации. Существуют методы, направленные на улучшение семантической структуры, но они либо требуют дополнительных параметров, либо не полностью адрессируют проблему. Наша мотивация заключается в создании рамочного подхода, который бы позволял моделям максимально эффективно использовать свои собственные выводы для улучшения семантической структуры внутреннего пространства признаков. #### Метод Мы предлагаем **Graph Consistency Regularization (GCR)**, новую фреймворк, который введет графовые структуры, полученные из выводов модели, в процесс обучения. Этот подход добавляет новый тип самопробуждения, позволяя модели очищать и повышать качество своих внутренних представлений. GCR работает путем создания **Graph Consistency Layers (GCL)** на разных уровнях сети. Эти слои строят графы семантических связей на основе выходов модели для каждого батча и выравнивают их с класс-ориентированным графом, построенным на основе классовых предсказаний. Это выравнивание гарантирует, что семантические отношения на уровне признаков отражают классовую консистентность. Чтобы улучшить эффективность, GCR включает в себя адаптивный механизм взвешивания для учитывания вклада каждого уровня в структуру. Таким образом, сеть может приоритетизировать надежные уровни представлений, отфильтровывая шумные слои. GCR является модельно-независимым, легковесным и может быть легко интегрирован в любую нейронную сеть. #### Результаты Мы проверили GCR на нескольких задачах классификации изображений, включая CIFAR-10, CIFAR-100 и ImageNet. Мы использовали различные модели, такие как ResNet и ViT, и сравнили результаты с традиционными методами. Результаты показали, что GCR улучшает семантическую структуру внутреннего пространства признаков, увеличивая коэффициент Джини и уменьшая значения intra-class distance. Эти улучшения приводят к значительному повышению качества и устойчивости прогнозов. Кроме того, мы провели эксперименты на задачах, требующих высокой семантической точности, и показали, что GCR позволяет модели лучше различать сложные классы, на

Abstract

We propose Graph Consistency Regularization (GCR), a novel framework that injects relational graph structures, derived from model predictions, into the learning process to promote class-aware, semantically meaningful feature representations. Functioning as a form of self-prompting, GCR enables the model to refine its internal structure using its own outputs. While deep networks learn rich representations, these often capture noisy inter-class similarities that contradict the model's predicted semantics. GCR addresses this issue by introducing parameter-free Graph Consistency Layers (GCLs) at arbitrary depths. Each GCL builds a batch-level feature similarity graph and aligns it with a global, class-aware masked prediction graph, derived by modulating softmax prediction similarities with intra-class indicators. This alignment enforces that feature-level relationships reflect class-consistent prediction behavior, acting as a semantic regularizer throughout the network. Unlike prior work, GCR introduces a multi-layer, cross-space graph alignment mechanism with adaptive weighting, where layer importance is learned from graph discrepancy magnitudes. This allows the model to prioritize semantically reliable layers and suppress noisy ones, enhancing feature quality without modifying the architecture or training procedure. GCR is model-agnostic, lightweight, and improves semantic structure across various networks and datasets. Experiments show that GCR promotes cleaner feature structure, stronger intra-class cohesion, and improved generalization, offering a new perspective on learning from prediction structure. [Project website](https://darcyddx.github.io/gcr/) [Code](https://github.com/Darcyddx/graph-prompt)

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Graph Your Own Prompt

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

TV2TV: A Unified Framework for Interleaved Language and Video Generation

The Universal Weight Subspace Hypothesis

STeP-Diff: Spatio-Temporal Physics-Informed Diffusion Models for Mobile Fine-Gra...

Open-Set Domain Adaptation Under Background Distribution Shift: Challenges and A...

First On-Orbit Demonstration of a Geospatial Foundation Model

Навигация