One Shot vs. Iterative: Rethinking Pruning Strategies for Model Compression

2508.13836v1 cs.LG, cs.AI 2025-08-21

Авторы:

Mikołaj Janusz, Tomasz Wojnar, Yawei Li, Luca Benini, Kamil Adamczewski

Резюме на русском

## Контекст Подборка нейронных сетей — ключевая техника для уменьшения размера моделей и улучшения их вычислительной эффективности. Обычно применяются два подхода к уменьшению модели: одиночное (one-shot) и итеративное (iterative) усечение сети. В первом случае усечение происходит в рамках одного цикла обучения и усечения, во втором — на несколько этапов, что позволяет добиться более тонкой оптимизации. Хотя итеративное усечение широко применяется в учебной практике, его преимущество не всегда обосновывается научно. Наша исследовательская работа представляет собой одно из первых систематических и подробных сравнений этих подходов, основываясь на точных определениях, сравнениях по разным условиям и моделям, а также применению разных критериев усечения. Мы выявили особенности каждого подхода: one-shot pruning более эффективен при небольших усечениях, а iterative pruning — при больших. Эти выводы позволяют нам предложить методы, которые могут повысить эффективность усечения для различных задач. ## Метод Мы разработали систематичный подход для сравнения one-shot и iterative pruning. Для этого определили критерии для каждого метода, включив различные модели, условия и критерии усечения. Мы проверили работу каждого подхода на разных задачах, например, обработке текста и изображений. Наша исследовательская модель предлагает подробные анализы различных моделей, а также использует различные модели нейронных сетей. Мы также применяем различные критерии усечения, такие как L1, L2, FLOPs и другие, чтобы понять, какие из них более эффективны в разных условиях. Эти эксперименты позволяют выявить главные преимущества и недостатки каждого подхода. ## Результаты Наши эксперименты показывают, что one-shot pruning более эффективен при усечении до 50%, но при больших усечениях iterative pruning становится предпочтительнее. Мы также показали, что различные критерии усечения могут привести к разным результатам в разных сценариях. Например, L1-критерий может быть более эффективен для большинства моделей, но L2 может дать лучший результат для некоторых. Мы также представили гибридный подход, который объединяет one-shot и iterative pruning, позволяющий повысить эффективность в некоторых случаях. Эти результаты позволяют выбирать подходы к усечению, оптимизируя их под конкретную задачу. ## Значимость Наша работа может быть применена в различных областях, где необходимо уменьшать размер моделей нейронных сетей, например, в мобильных приложениях, дальнейшему развитию ИИ и более эффективных сетях. Мы показали, что каждый подход к усечению может быть эффективен в зависимости от сценария и требований. Использование гибридного подхода может повысить эффектив

Abstract

Pruning is a core technique for compressing neural networks to improve computational efficiency. This process is typically approached in two ways: one-shot pruning, which involves a single pass of training and pruning, and iterative pruning, where pruning is performed over multiple cycles for potentially finer network refinement. Although iterative pruning has historically seen broader adoption, this preference is often assumed rather than rigorously tested. Our study presents one of the first systematic and comprehensive comparisons of these methods, providing rigorous definitions, benchmarking both across structured and unstructured settings, and applying different pruning criteria and modalities. We find that each method has specific advantages: one-shot pruning proves more effective at lower pruning ratios, while iterative pruning performs better at higher ratios. Building on these findings, we advocate for patience-based pruning and introduce a hybrid approach that can outperform traditional methods in certain scenarios, providing valuable insights for practitioners selecting a pruning strategy tailored to their goals and constraints. Source code is available at https://github.com/janumiko/pruning-benchmark.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

One Shot vs. Iterative: Rethinking Pruning Strategies for Model Compression

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Approximation of Box Decomposition Algorithm for Fast Hypervolume-Based Multi-Ob...

NEAT: Neighborhood-Guided, Efficient, Autoregressive Set Transformer for 3D Mole...

Sparse Attention Post-Training for Mechanistic Interpretability

Neural Coherence : Find higher performance to out-of-distribution tasks from few...

Impugan: Learning Conditional Generative Models for Robust Data Imputation

Навигация