NM-Hebb: Coupling Local Hebbian Plasticity with Metric Learning for More Accurate and Interpretable CNNs
2508.19896v1
cs.LG, cs.CV, I.2.6; I.5.4
2025-08-29
Авторы:
Davorin Miličević, Ratko Grbić
Резюме на русском
#### Контекст
Дилемма высокой точности и низкой интерпретируемости глубоких сверточных нейронных сетей (Deep Convolutional Neural Networks, CNNs) остается значимой проблемой в искусственном интеллекте. Несмотря на их великолепные результаты в задачах классификации, CNNs часто терпят от применению глобальных, градиентно-ориентированных методов обучения. Эти методы приводят к переобучению, неэффективному использованию фильтров и ухудшению интерпретируемости модели. Эти проблемы являются мотивацией для разработки новых подходов, которые объединяют локальные механизмы с дистанционно-акцентированным вниманием.
#### Метод
Методология NM-Hebb представляет собой двухфазный подход. **Фаза 1** базируется на стандартном супервизированном обучении, но включает дополнительные механизмы: (i) **Hebbian regulariser**, который стимулирует спатспейсные зависимости между активациями и фильтрами, и (ii) **neuromodulator**, который эластично консолидирует параметры без замораживания модели. **Фаза 2**, в свою очередь, использует **pairwise metric learning** для точечного уточнения позиционирования классов в embedding-пространстве. Такой подход объединяет локальные Hebbian-механизмы с глобальными метрическими аспектами для достижения высокой точности и интерпретируемости.
#### Результаты
Исследования проводились на датасетах CIFAR-10, CIFAR-100 и TinyImageNet с помощью пяти различных архитектур (ResNet-18, VGG-11, MobileNet-v2, EfficientNet-V2 и DenseNet-121). Результаты показали, что NM-Hebb опережает базовые модели и другие методы по точности (до +10.0 pp на CIFAR-10) и Normalised Mutual Information (до +0.15). Эмпирические анализы подтверждают, что модели NM-Hebb продуцируют более структурированные и интерпретируемые фильтры, что улучшает их применимость в задачах обнаружения.
#### Значимость
NM-Hebb предлагает практическое значение, особенно для ресурс-ограниченных и безопасности-критичных систем. Интеграция Hebbian-механизмов с метрическим обучением делает модели более эффективными в обнаружении и классификации. Эта архитектура может применяться в медицине, транспорте и прочих областях, где точность и модельная прозрачность критичны.
#### Выводы
NM-Hebb достигает согласованных улучшений в точности по сравнению с базовыми моделями и другими подходами. Он раскрывает перспективы для использования Hebbian-методов в сочетании с метрическим learning для улучшения точности и интерпретируемости CNNs. Будущие исследования будут направлены на расширение NM-Hebb для более крупных датасетов и дополнительных типов задач, таких как задачи регрессии и рекомендательные системы.
Abstract
Deep Convolutional Neural Networks (CNNs) achieve high accuracy but often
rely on purely global, gradient-based optimisation, which can lead to
overfitting, redundant filters, and reduced interpretability. To address these
limitations, we propose NM-Hebb, a two-phase training framework that integrates
neuro-inspired local plasticity with distance-aware supervision. Phase 1
extends standard supervised training by jointly optimising a cross-entropy
objective with two biologically inspired mechanisms: (i) a Hebbian regulariser
that aligns the spatial mean of activations with the mean of the corresponding
convolutional filter weights, encouraging structured, reusable primitives; and
(ii) a learnable neuromodulator that gates an elastic-weight-style
consolidation loss, preserving beneficial parameters without freezing the
network. Phase 2 fine-tunes the backbone with a pairwise metric-learning loss,
explicitly compressing intra-class distances and enlarging inter-class margins
in the embedding space. Evaluated on CIFAR-10, CIFAR-100, and TinyImageNet
across five backbones (ResNet-18, VGG-11, MobileNet-v2, EfficientNet-V2,
DenseNet-121), NM-Hebb achieves consistent gains over baseline and other
methods: Top-1 accuracy improves by +2.0-10.0 pp (CIFAR-10), +2.0-9.0 pp
(CIFAR-100), and up to +4.3-8.9 pp (TinyImageNet), with Normalised Mutual
Information (NMI) increased by up to +0.15. Qualitative visualisations and
filter-level analyses further confirm that NM-Hebb produces more structured and
selective features, yielding tighter and more interpretable class clusters.
Overall, coupling local Hebbian plasticity with metric-based fine-tuning yields
CNNs that are not only more accurate but also more interpretable, offering
practical benefits for resource-constrained and safety-critical AI deployments.