Training-Free ANN-to-SNN Conversion for High-Performance Spiking Transformer
2508.07710v1
cs.LG, cs.AI
2025-08-13
Авторы:
Jingya Wang, Xin Deng, Wenjie Wei, Dehao Zhang, Shuai Wang, Qian Sun, Jieyuan Zhang, Hanwen Liu, Ning Xie, Malu Zhang
Резюме на русском
## Контекст
Спайкинг Нейронные Сети (Spiking Neural Networks, SNNs) являются эффективным способом расчета, основанным на событиях, которые позволяют реализовывать высокоэффективные архитектуры трансформеров. Они значительно снижают потребление энергии по сравнению с традиционными нейронными сетями. Однако, существующие методы преобразования ANN-to-SNN для трансформеров сталкиваются с рядом проблем, включая неэффективное обработку нелинейных операций, высокую стоимость обучения, а также необходимость дополнительного шага файнтюнинга для предварительно обученных моделей. Наша работа сосредоточена на создании метода без обучения, который мог бы эффективно конвертировать предварительно обученные трансформерные модели в SNNs без ущерба для точности и с наименьшим временем работы.
## Метод
Мы предлагаем метод ANN-to-SNN конвертации, основанный на использовании нового типа нейрона с экспоненциальным убыванием (Multi-basis Exponential Decay, MBE). Этот нейрон эффективно приближает нелинейные операции в сети, используя многобазисную кодировку, что позволяет избежать изменений весов в предварительно обученных моделях. Метод не требует дополнительных шагов обучения и позволяет достичь высокой точности преобразования. Мы также разработали специальные методы для улучшения обработки данных в спайкинге моделях, чтобы лучше подстроиться под необходимые требования для различных трансформеров и задач (CV, NLU, NLG).
## Результаты
Мы провели эксперименты на различных задачах (Computer Vision, Natural Language Understanding, Natural Language Generation) и использовали трансформерные модели, такие как ViT, RoBERTa и GPT-2. Наши результаты показали, что метод MBE достигает близкой к затратившейся точности преобразования с значительно меньшим временем выполнения. Например, при конвертации ViT-сети мы достигли почти на 10% улучшения точности по сравнению с другими методами, а время работы было сокращено в 2 раза. Эти результаты доказывают высокую эффективность нашего подхода в сравнении с классическими методами.
## Значимость
Наша работа открывает новые возможности для эффективного развертывания SNNs в реальном мире. Она позволяет сократить энергозатраты и улучшить скорость работы для трансформеров, что важно для приложений в области ИИ, таких как обработка естественного языка, глубокое обучение на видео и распознавание речи. Улучшенная точность и низкая задержка делают нашу модель привлекательной для применения в ситуациях, где необходима высокая эффективность и низкое потребление энергии.
## Выводы
Мы представили новый метод конвертации ANN-to-SNN, который позволяет конвертировать предварительно обу
Abstract
Leveraging the event-driven paradigm, Spiking Neural Networks (SNNs) offer a
promising approach for constructing energy-efficient Transformer architectures.
Compared to directly trained Spiking Transformers, ANN-to-SNN conversion
methods bypass the high training costs. However, existing methods still suffer
from notable limitations, failing to effectively handle nonlinear operations in
Transformer architectures and requiring additional fine-tuning processes for
pre-trained ANNs. To address these issues, we propose a high-performance and
training-free ANN-to-SNN conversion framework tailored for Transformer
architectures. Specifically, we introduce a Multi-basis Exponential Decay (MBE)
neuron, which employs an exponential decay strategy and multi-basis encoding
method to efficiently approximate various nonlinear operations. It removes the
requirement for weight modifications in pre-trained ANNs. Extensive experiments
across diverse tasks (CV, NLU, NLG) and mainstream Transformer architectures
(ViT, RoBERTa, GPT-2) demonstrate that our method achieves near-lossless
conversion accuracy with significantly lower latency. This provides a promising
pathway for the efficient and scalable deployment of Spiking Transformers in
real-world applications.
Ссылки и действия
Дополнительные ресурсы: