Synaptic Pruning: A Biological Inspiration for Deep Learning Regularization
2508.09330v1
cs.LG, cs.AI
2025-08-15
Авторы:
Gideon Vos, Liza van Eijk, Zoltan Sarnyai, Mostafa Rahimi Azghadi
Резюме на русском
## Контекст
В области нейронаучных исследований одной из актуальных проблем является улучшение регуляризационных методов, применяемых в нейронных сетях. Одним из важных аспектов этого вопроса является механизм **synaptic pruning** в биологических мозгах, когда медленные или ненужные синаптические связи удаляются для оптимизации эффективности работы системы. В то же время, в случае артифициальных нейронных сетей, методы регуляризации, такие как **dropout**, не учитывают активность связей и произвольно удаляют нейроны, что может привести к потере значимых связей. Это приводит к необходимости разработки более эффективных методов, которые будут ближе адаптированы к принципам биологических систем.
## Метод
В ходе исследования был разработан **magnitude-based synaptic pruning** метод, который динамически оценивает важность связей во время обучения нейронных сетей. Метод интегрируется непосредственно в цикл обучения в качестве альтернативы к стандартному методу **dropout**. Визуально он работает так: во время обучения происходит временное отключение слабых связей (применяется подход с **progressive sparsification**), что позволяет сохранить градиентный поток для активных связей. Таким образом, в каждом шаге обучения происходит уменьшение глобального спарсинга в сети, что приводит к улучшению производительности. Также, для управления этим процессом введена **cubic schedule**, которая регулирует степень спарсинга в зависимости от времени обучения. Этот подход позволяет избежать отдельного этапа прунинга и последующего оптимизации, который традиционно применяется в других методах.
## Результаты
Разработанный метод был проверен на нескольких моделях временных рядов, включая **RNN**, **LSTM** и **Patch Time Series Transformer**, на четырёх различных датасетах. Он показал статистически значимые улучшения в сравнении с базовыми моделями и моделями с применением стандартного **dropout**. Например, в случае финансового прогнозирования, **magnitude-based synaptic pruning** уменьшил **Mean Absolute Error (MAE)** до 20% в сравнении с моделями без регуляризации, и даже до 52% при использовании некоторых моделей трансформеров. Этот результат подтверждает значительную эффективность нового метода в регуляризации нейронных сетей.
## Значимость
Новый подход может быть применен в различных областях, таких как **финансовый анализ**, **рекомендательные системы**, **идентификация объектов на изображениях** и др. Благодаря тому, что он динамически оптимизирует сеть в процессе обучения, он предлагает более эффективное решение, чем стандартные методы. Это дает потенциал для улучшения производительности моделей в сложных задачах, таких как прогнозирование финансовых показа
Abstract
Synaptic pruning in biological brains removes weak connections to improve
efficiency. In contrast, dropout regularization in artificial neural networks
randomly deactivates neurons without considering activity-dependent pruning. We
propose a magnitude-based synaptic pruning method that better reflects biology
by progressively removing low-importance connections during training.
Integrated directly into the training loop as a dropout replacement, our
approach computes weight importance from absolute magnitudes across layers and
applies a cubic schedule to gradually increase global sparsity. At fixed
intervals, pruning masks permanently remove low-importance weights while
maintaining gradient flow for active ones, eliminating the need for separate
pruning and fine-tuning phases. Experiments on multiple time series forecasting
models including RNN, LSTM, and Patch Time Series Transformer across four
datasets show consistent gains. Our method ranked best overall, with
statistically significant improvements confirmed by Friedman tests (p < 0.01).
In financial forecasting, it reduced Mean Absolute Error by up to 20% over
models with no or standard dropout, and up to 52% in select transformer models.
This dynamic pruning mechanism advances regularization by coupling weight
elimination with progressive sparsification, offering easy integration into
diverse architectures. Its strong performance, especially in financial time
series forecasting, highlights its potential as a practical alternative to
conventional dropout techniques.
Ссылки и действия
Дополнительные ресурсы: