Training-Free ANN-to-SNN Conversion for High-Performance Spiking Transformer

2508.07710v1 cs.LG, cs.AI 2025-08-13
Авторы:

Jingya Wang, Xin Deng, Wenjie Wei, Dehao Zhang, Shuai Wang, Qian Sun, Jieyuan Zhang, Hanwen Liu, Ning Xie, Malu Zhang

Резюме на русском

## Контекст Спайкинг Нейронные Сети (Spiking Neural Networks, SNNs) являются эффективным способом расчета, основанным на событиях, которые позволяют реализовывать высокоэффективные архитектуры трансформеров. Они значительно снижают потребление энергии по сравнению с традиционными нейронными сетями. Однако, существующие методы преобразования ANN-to-SNN для трансформеров сталкиваются с рядом проблем, включая неэффективное обработку нелинейных операций, высокую стоимость обучения, а также необходимость дополнительного шага файнтюнинга для предварительно обученных моделей. Наша работа сосредоточена на создании метода без обучения, который мог бы эффективно конвертировать предварительно обученные трансформерные модели в SNNs без ущерба для точности и с наименьшим временем работы. ## Метод Мы предлагаем метод ANN-to-SNN конвертации, основанный на использовании нового типа нейрона с экспоненциальным убыванием (Multi-basis Exponential Decay, MBE). Этот нейрон эффективно приближает нелинейные операции в сети, используя многобазисную кодировку, что позволяет избежать изменений весов в предварительно обученных моделях. Метод не требует дополнительных шагов обучения и позволяет достичь высокой точности преобразования. Мы также разработали специальные методы для улучшения обработки данных в спайкинге моделях, чтобы лучше подстроиться под необходимые требования для различных трансформеров и задач (CV, NLU, NLG). ## Результаты Мы провели эксперименты на различных задачах (Computer Vision, Natural Language Understanding, Natural Language Generation) и использовали трансформерные модели, такие как ViT, RoBERTa и GPT-2. Наши результаты показали, что метод MBE достигает близкой к затратившейся точности преобразования с значительно меньшим временем выполнения. Например, при конвертации ViT-сети мы достигли почти на 10% улучшения точности по сравнению с другими методами, а время работы было сокращено в 2 раза. Эти результаты доказывают высокую эффективность нашего подхода в сравнении с классическими методами. ## Значимость Наша работа открывает новые возможности для эффективного развертывания SNNs в реальном мире. Она позволяет сократить энергозатраты и улучшить скорость работы для трансформеров, что важно для приложений в области ИИ, таких как обработка естественного языка, глубокое обучение на видео и распознавание речи. Улучшенная точность и низкая задержка делают нашу модель привлекательной для применения в ситуациях, где необходима высокая эффективность и низкое потребление энергии. ## Выводы Мы представили новый метод конвертации ANN-to-SNN, который позволяет конвертировать предварительно обу

Abstract

Leveraging the event-driven paradigm, Spiking Neural Networks (SNNs) offer a promising approach for constructing energy-efficient Transformer architectures. Compared to directly trained Spiking Transformers, ANN-to-SNN conversion methods bypass the high training costs. However, existing methods still suffer from notable limitations, failing to effectively handle nonlinear operations in Transformer architectures and requiring additional fine-tuning processes for pre-trained ANNs. To address these issues, we propose a high-performance and training-free ANN-to-SNN conversion framework tailored for Transformer architectures. Specifically, we introduce a Multi-basis Exponential Decay (MBE) neuron, which employs an exponential decay strategy and multi-basis encoding method to efficiently approximate various nonlinear operations. It removes the requirement for weight modifications in pre-trained ANNs. Extensive experiments across diverse tasks (CV, NLU, NLG) and mainstream Transformer architectures (ViT, RoBERTa, GPT-2) demonstrate that our method achieves near-lossless conversion accuracy with significantly lower latency. This provides a promising pathway for the efficient and scalable deployment of Spiking Transformers in real-world applications.

Ссылки и действия