A Self-Ensemble Inspired Approach for Effective Training of Binary-Weight Spiking Neural Networks

2508.12609v1 cs.NE, cs.LG 2025-08-20
Авторы:

Qingyan Meng, Mingqing Xiao, Zhengyu Ma, Huihui Zhou, Yonghong Tian, Zhouchen Lin

Резюме на русском

#### Контекст Появление различных архитектур нейронных сетей в системах машинного обучения способствовало развитию низкоэнергоемких и эффективных решений. Одной из таких архитектур являются Spiking Neural Networks (SNNs), которыми стали символизировать низкую энергоемкость и их подходность для использования на neuromorphic железе. Однако, необходимость использовать обратную проходную оценку (backpropagation) с некоторыми сводительными спайками (surrogate gradients), а также сложность в оптимизации нейронов с бинарными весами, представляют сложности в обучении таких сетей. Binary Neural Networks (BNNs) также сталкиваются с аналогичными проблемами в обучении. В данной работе авторы изучают симметричное соотношение между технологиями SNNs и BNNs, предлагая новую методологию, которая может систематически облегчить процесс обучения binary-weight spiking neural networks (BWSNNs). #### Метод Авторы предлагают новую философию рассмотрения SNNs, подчеркивая их сходство с BNNs, а именно, что обучение feedforward SNNs может рассматриваться как обучение самосборки (self-ensemble) бинарного сетевого активационного компонента с внедрением шума. Это новое понимание SNN динамики вдохновило на предложение Self-Ensemble Inspired (SEI) training method, который может использоваться для обучения BWSNNs. Основными компонентами метода являются структура нескольких шорткатов (shortcuts) и техника знаний передачи (knowledge distillation), которые улучшают процесс обучения. Особенно выдающимся является использование binarization FFN-слоев в Transformer-архитектуре, что позволяет достичь 82.52% точности на популярном датасете ImageNet с во время только 2-х временных шагов. #### Результаты Авторы проводили эксперименты с использованием стандартных датасетов, включая CIFAR-10 и ImageNet. Они сравнивали результаты с другими подходами, показав, что их SEI-BWSNN-метод позволяет достичь высокой точности с низкой энергоемкостью и низким временем обучения. На датасете ImageNet, при использовании только 2-х временных шагов, SEI-BWSNN достиг 82.52% точности, что является высоким показателем, демонстрирующим эффективность нового подхода. #### Значимость Работа предлагает новый подход к обучению BWSNNs, который может быть применен в широком круге приложений, где требуется большая скорость обработки и минимальное потребление энергии. Основные преимущества — это улучшенная точность, эффективность в обучении, а также повышение производительности для низко-бинарных архитектур. Этот подход может поднять перспективы использования SNNs в приложениях, где требуются высокая скорость работы и энергосбережение, такие как IoT, безопасность и даже робототехника. #### Выводы Выводы: Авторы утверждают, что новый под

Abstract

Spiking Neural Networks (SNNs) are a promising approach to low-power applications on neuromorphic hardware due to their energy efficiency. However, training SNNs is challenging because of the non-differentiable spike generation function. To address this issue, the commonly used approach is to adopt the backpropagation through time framework, while assigning the gradient of the non-differentiable function with some surrogates. Similarly, Binary Neural Networks (BNNs) also face the non-differentiability problem and rely on approximating gradients. However, the deep relationship between these two fields and how their training techniques can benefit each other has not been systematically researched. Furthermore, training binary-weight SNNs is even more difficult. In this work, we present a novel perspective on the dynamics of SNNs and their close connection to BNNs through an analysis of the backpropagation process. We demonstrate that training a feedforward SNN can be viewed as training a self-ensemble of a binary-activation neural network with noise injection. Drawing from this new understanding of SNN dynamics, we introduce the Self-Ensemble Inspired training method for (Binary-Weight) SNNs (SEI-BWSNN), which achieves high-performance results with low latency even for the case of the 1-bit weights. Specifically, we leverage a structure of multiple shortcuts and a knowledge distillation-based training technique to improve the training of (binary-weight) SNNs. Notably, by binarizing FFN layers in a Transformer architecture, our approach achieves 82.52% accuracy on ImageNet with only 2 time steps, indicating the effectiveness of our methodology and the potential of binary-weight SNNs.

Ссылки и действия