Synaptic Pruning: A Biological Inspiration for Deep Learning Regularization

2508.09330v1 cs.LG, cs.AI 2025-08-15
Авторы:

Gideon Vos, Liza van Eijk, Zoltan Sarnyai, Mostafa Rahimi Azghadi

Резюме на русском

## Контекст В области нейронаучных исследований одной из актуальных проблем является улучшение регуляризационных методов, применяемых в нейронных сетях. Одним из важных аспектов этого вопроса является механизм **synaptic pruning** в биологических мозгах, когда медленные или ненужные синаптические связи удаляются для оптимизации эффективности работы системы. В то же время, в случае артифициальных нейронных сетей, методы регуляризации, такие как **dropout**, не учитывают активность связей и произвольно удаляют нейроны, что может привести к потере значимых связей. Это приводит к необходимости разработки более эффективных методов, которые будут ближе адаптированы к принципам биологических систем. ## Метод В ходе исследования был разработан **magnitude-based synaptic pruning** метод, который динамически оценивает важность связей во время обучения нейронных сетей. Метод интегрируется непосредственно в цикл обучения в качестве альтернативы к стандартному методу **dropout**. Визуально он работает так: во время обучения происходит временное отключение слабых связей (применяется подход с **progressive sparsification**), что позволяет сохранить градиентный поток для активных связей. Таким образом, в каждом шаге обучения происходит уменьшение глобального спарсинга в сети, что приводит к улучшению производительности. Также, для управления этим процессом введена **cubic schedule**, которая регулирует степень спарсинга в зависимости от времени обучения. Этот подход позволяет избежать отдельного этапа прунинга и последующего оптимизации, который традиционно применяется в других методах. ## Результаты Разработанный метод был проверен на нескольких моделях временных рядов, включая **RNN**, **LSTM** и **Patch Time Series Transformer**, на четырёх различных датасетах. Он показал статистически значимые улучшения в сравнении с базовыми моделями и моделями с применением стандартного **dropout**. Например, в случае финансового прогнозирования, **magnitude-based synaptic pruning** уменьшил **Mean Absolute Error (MAE)** до 20% в сравнении с моделями без регуляризации, и даже до 52% при использовании некоторых моделей трансформеров. Этот результат подтверждает значительную эффективность нового метода в регуляризации нейронных сетей. ## Значимость Новый подход может быть применен в различных областях, таких как **финансовый анализ**, **рекомендательные системы**, **идентификация объектов на изображениях** и др. Благодаря тому, что он динамически оптимизирует сеть в процессе обучения, он предлагает более эффективное решение, чем стандартные методы. Это дает потенциал для улучшения производительности моделей в сложных задачах, таких как прогнозирование финансовых показа

Abstract

Synaptic pruning in biological brains removes weak connections to improve efficiency. In contrast, dropout regularization in artificial neural networks randomly deactivates neurons without considering activity-dependent pruning. We propose a magnitude-based synaptic pruning method that better reflects biology by progressively removing low-importance connections during training. Integrated directly into the training loop as a dropout replacement, our approach computes weight importance from absolute magnitudes across layers and applies a cubic schedule to gradually increase global sparsity. At fixed intervals, pruning masks permanently remove low-importance weights while maintaining gradient flow for active ones, eliminating the need for separate pruning and fine-tuning phases. Experiments on multiple time series forecasting models including RNN, LSTM, and Patch Time Series Transformer across four datasets show consistent gains. Our method ranked best overall, with statistically significant improvements confirmed by Friedman tests (p < 0.01). In financial forecasting, it reduced Mean Absolute Error by up to 20% over models with no or standard dropout, and up to 52% in select transformer models. This dynamic pruning mechanism advances regularization by coupling weight elimination with progressive sparsification, offering easy integration into diverse architectures. Its strong performance, especially in financial time series forecasting, highlights its potential as a practical alternative to conventional dropout techniques.

Ссылки и действия