One Shot vs. Iterative: Rethinking Pruning Strategies for Model Compression
2508.13836v1
cs.LG, cs.AI
2025-08-21
Авторы:
Mikołaj Janusz, Tomasz Wojnar, Yawei Li, Luca Benini, Kamil Adamczewski
Резюме на русском
## Контекст
Подборка нейронных сетей — ключевая техника для уменьшения размера моделей и улучшения их вычислительной эффективности. Обычно применяются два подхода к уменьшению модели: одиночное (one-shot) и итеративное (iterative) усечение сети. В первом случае усечение происходит в рамках одного цикла обучения и усечения, во втором — на несколько этапов, что позволяет добиться более тонкой оптимизации. Хотя итеративное усечение широко применяется в учебной практике, его преимущество не всегда обосновывается научно. Наша исследовательская работа представляет собой одно из первых систематических и подробных сравнений этих подходов, основываясь на точных определениях, сравнениях по разным условиям и моделям, а также применению разных критериев усечения. Мы выявили особенности каждого подхода: one-shot pruning более эффективен при небольших усечениях, а iterative pruning — при больших. Эти выводы позволяют нам предложить методы, которые могут повысить эффективность усечения для различных задач.
## Метод
Мы разработали систематичный подход для сравнения one-shot и iterative pruning. Для этого определили критерии для каждого метода, включив различные модели, условия и критерии усечения. Мы проверили работу каждого подхода на разных задачах, например, обработке текста и изображений. Наша исследовательская модель предлагает подробные анализы различных моделей, а также использует различные модели нейронных сетей. Мы также применяем различные критерии усечения, такие как L1, L2, FLOPs и другие, чтобы понять, какие из них более эффективны в разных условиях. Эти эксперименты позволяют выявить главные преимущества и недостатки каждого подхода.
## Результаты
Наши эксперименты показывают, что one-shot pruning более эффективен при усечении до 50%, но при больших усечениях iterative pruning становится предпочтительнее. Мы также показали, что различные критерии усечения могут привести к разным результатам в разных сценариях. Например, L1-критерий может быть более эффективен для большинства моделей, но L2 может дать лучший результат для некоторых. Мы также представили гибридный подход, который объединяет one-shot и iterative pruning, позволяющий повысить эффективность в некоторых случаях. Эти результаты позволяют выбирать подходы к усечению, оптимизируя их под конкретную задачу.
## Значимость
Наша работа может быть применена в различных областях, где необходимо уменьшать размер моделей нейронных сетей, например, в мобильных приложениях, дальнейшему развитию ИИ и более эффективных сетях. Мы показали, что каждый подход к усечению может быть эффективен в зависимости от сценария и требований. Использование гибридного подхода может повысить эффектив
Abstract
Pruning is a core technique for compressing neural networks to improve
computational efficiency. This process is typically approached in two ways:
one-shot pruning, which involves a single pass of training and pruning, and
iterative pruning, where pruning is performed over multiple cycles for
potentially finer network refinement. Although iterative pruning has
historically seen broader adoption, this preference is often assumed rather
than rigorously tested. Our study presents one of the first systematic and
comprehensive comparisons of these methods, providing rigorous definitions,
benchmarking both across structured and unstructured settings, and applying
different pruning criteria and modalities. We find that each method has
specific advantages: one-shot pruning proves more effective at lower pruning
ratios, while iterative pruning performs better at higher ratios. Building on
these findings, we advocate for patience-based pruning and introduce a hybrid
approach that can outperform traditional methods in certain scenarios,
providing valuable insights for practitioners selecting a pruning strategy
tailored to their goals and constraints. Source code is available at
https://github.com/janumiko/pruning-benchmark.
Ссылки и действия
Дополнительные ресурсы: