A Self-Ensemble Inspired Approach for Effective Training of Binary-Weight Spiking Neural Networks
2508.12609v1
cs.NE, cs.LG
2025-08-20
Авторы:
Qingyan Meng, Mingqing Xiao, Zhengyu Ma, Huihui Zhou, Yonghong Tian, Zhouchen Lin
Резюме на русском
#### Контекст
Появление различных архитектур нейронных сетей в системах машинного обучения способствовало развитию низкоэнергоемких и эффективных решений. Одной из таких архитектур являются Spiking Neural Networks (SNNs), которыми стали символизировать низкую энергоемкость и их подходность для использования на neuromorphic железе. Однако, необходимость использовать обратную проходную оценку (backpropagation) с некоторыми сводительными спайками (surrogate gradients), а также сложность в оптимизации нейронов с бинарными весами, представляют сложности в обучении таких сетей. Binary Neural Networks (BNNs) также сталкиваются с аналогичными проблемами в обучении. В данной работе авторы изучают симметричное соотношение между технологиями SNNs и BNNs, предлагая новую методологию, которая может систематически облегчить процесс обучения binary-weight spiking neural networks (BWSNNs).
#### Метод
Авторы предлагают новую философию рассмотрения SNNs, подчеркивая их сходство с BNNs, а именно, что обучение feedforward SNNs может рассматриваться как обучение самосборки (self-ensemble) бинарного сетевого активационного компонента с внедрением шума. Это новое понимание SNN динамики вдохновило на предложение Self-Ensemble Inspired (SEI) training method, который может использоваться для обучения BWSNNs. Основными компонентами метода являются структура нескольких шорткатов (shortcuts) и техника знаний передачи (knowledge distillation), которые улучшают процесс обучения. Особенно выдающимся является использование binarization FFN-слоев в Transformer-архитектуре, что позволяет достичь 82.52% точности на популярном датасете ImageNet с во время только 2-х временных шагов.
#### Результаты
Авторы проводили эксперименты с использованием стандартных датасетов, включая CIFAR-10 и ImageNet. Они сравнивали результаты с другими подходами, показав, что их SEI-BWSNN-метод позволяет достичь высокой точности с низкой энергоемкостью и низким временем обучения. На датасете ImageNet, при использовании только 2-х временных шагов, SEI-BWSNN достиг 82.52% точности, что является высоким показателем, демонстрирующим эффективность нового подхода.
#### Значимость
Работа предлагает новый подход к обучению BWSNNs, который может быть применен в широком круге приложений, где требуется большая скорость обработки и минимальное потребление энергии. Основные преимущества — это улучшенная точность, эффективность в обучении, а также повышение производительности для низко-бинарных архитектур. Этот подход может поднять перспективы использования SNNs в приложениях, где требуются высокая скорость работы и энергосбережение, такие как IoT, безопасность и даже робототехника.
#### Выводы
Выводы: Авторы утверждают, что новый под
Abstract
Spiking Neural Networks (SNNs) are a promising approach to low-power
applications on neuromorphic hardware due to their energy efficiency. However,
training SNNs is challenging because of the non-differentiable spike generation
function. To address this issue, the commonly used approach is to adopt the
backpropagation through time framework, while assigning the gradient of the
non-differentiable function with some surrogates. Similarly, Binary Neural
Networks (BNNs) also face the non-differentiability problem and rely on
approximating gradients. However, the deep relationship between these two
fields and how their training techniques can benefit each other has not been
systematically researched. Furthermore, training binary-weight SNNs is even
more difficult. In this work, we present a novel perspective on the dynamics of
SNNs and their close connection to BNNs through an analysis of the
backpropagation process. We demonstrate that training a feedforward SNN can be
viewed as training a self-ensemble of a binary-activation neural network with
noise injection. Drawing from this new understanding of SNN dynamics, we
introduce the Self-Ensemble Inspired training method for (Binary-Weight) SNNs
(SEI-BWSNN), which achieves high-performance results with low latency even for
the case of the 1-bit weights. Specifically, we leverage a structure of
multiple shortcuts and a knowledge distillation-based training technique to
improve the training of (binary-weight) SNNs. Notably, by binarizing FFN layers
in a Transformer architecture, our approach achieves 82.52% accuracy on
ImageNet with only 2 time steps, indicating the effectiveness of our
methodology and the potential of binary-weight SNNs.
Ссылки и действия
Дополнительные ресурсы: