Graph Your Own Prompt
2509.23373v1
cs.LG, cs.AI, cs.CV
2025-10-01
Авторы:
Xi Ding, Lei Wang, Piotr Koniusz, Yongsheng Gao
Резюме на русском
#### Контекст
Глубокие нейронные сети достигли впечатляющих результатов в обработке и анализе изображений, текста, звука и других типов данных. Однако они часто сталкиваются с проблемой недостаточной семантической структуры в пространстве признаков. Например, они могут сопоставить не относящиеся друг к другу объекты, такие как "кошка" и "собака", в одном пространстве признаков, что приводит к нежелательным пересечениям между классами. Эта проблема становится важной, когда сети используются в задачах, требующих высокой точности или семантической классификации. Существуют методы, направленные на улучшение семантической структуры, но они либо требуют дополнительных параметров, либо не полностью адрессируют проблему. Наша мотивация заключается в создании рамочного подхода, который бы позволял моделям максимально эффективно использовать свои собственные выводы для улучшения семантической структуры внутреннего пространства признаков.
#### Метод
Мы предлагаем **Graph Consistency Regularization (GCR)**, новую фреймворк, который введет графовые структуры, полученные из выводов модели, в процесс обучения. Этот подход добавляет новый тип самопробуждения, позволяя модели очищать и повышать качество своих внутренних представлений. GCR работает путем создания **Graph Consistency Layers (GCL)** на разных уровнях сети. Эти слои строят графы семантических связей на основе выходов модели для каждого батча и выравнивают их с класс-ориентированным графом, построенным на основе классовых предсказаний. Это выравнивание гарантирует, что семантические отношения на уровне признаков отражают классовую консистентность. Чтобы улучшить эффективность, GCR включает в себя адаптивный механизм взвешивания для учитывания вклада каждого уровня в структуру. Таким образом, сеть может приоритетизировать надежные уровни представлений, отфильтровывая шумные слои. GCR является модельно-независимым, легковесным и может быть легко интегрирован в любую нейронную сеть.
#### Результаты
Мы проверили GCR на нескольких задачах классификации изображений, включая CIFAR-10, CIFAR-100 и ImageNet. Мы использовали различные модели, такие как ResNet и ViT, и сравнили результаты с традиционными методами. Результаты показали, что GCR улучшает семантическую структуру внутреннего пространства признаков, увеличивая коэффициент Джини и уменьшая значения intra-class distance. Эти улучшения приводят к значительному повышению качества и устойчивости прогнозов. Кроме того, мы провели эксперименты на задачах, требующих высокой семантической точности, и показали, что GCR позволяет модели лучше различать сложные классы, на
Abstract
We propose Graph Consistency Regularization (GCR), a novel framework that
injects relational graph structures, derived from model predictions, into the
learning process to promote class-aware, semantically meaningful feature
representations. Functioning as a form of self-prompting, GCR enables the model
to refine its internal structure using its own outputs. While deep networks
learn rich representations, these often capture noisy inter-class similarities
that contradict the model's predicted semantics. GCR addresses this issue by
introducing parameter-free Graph Consistency Layers (GCLs) at arbitrary depths.
Each GCL builds a batch-level feature similarity graph and aligns it with a
global, class-aware masked prediction graph, derived by modulating softmax
prediction similarities with intra-class indicators. This alignment enforces
that feature-level relationships reflect class-consistent prediction behavior,
acting as a semantic regularizer throughout the network. Unlike prior work, GCR
introduces a multi-layer, cross-space graph alignment mechanism with adaptive
weighting, where layer importance is learned from graph discrepancy magnitudes.
This allows the model to prioritize semantically reliable layers and suppress
noisy ones, enhancing feature quality without modifying the architecture or
training procedure. GCR is model-agnostic, lightweight, and improves semantic
structure across various networks and datasets. Experiments show that GCR
promotes cleaner feature structure, stronger intra-class cohesion, and improved
generalization, offering a new perspective on learning from prediction
structure. [Project website](https://darcyddx.github.io/gcr/)
[Code](https://github.com/Darcyddx/graph-prompt)
Ссылки и действия
Дополнительные ресурсы: