GRAFT: Gradient-Aware Fast MaxVol Technique for Dynamic Data Sampling
2508.13653v1
cs.LG, cs.AI, cs.NA, math.NA
2025-08-21
Авторы:
Ashish Jha, Anh huy Phan, Razan Dibo, Valentin Leplat
Резюме на русском
## Контекст
Современные нейронные сети требуют большого объема вычислительных ресурсов и энергии для обучения, особенно при работе с огромными данными. Это приводит к повышенным экономическим и экологическим затратам. Одной из проблем является эффективное выборение подмножества данных для обучения, которое позволило бы сократить время обучения и энергоспособность без существенного ухудшения точности модели. Данная работа адресует эту проблему, предложив новую методику для динамического выбора подмножеств данных в ходе обучения.
## Метод
Метод, предлагаемый в работе, называется **GRAFT** (Gradient-Aware Fast MaxVol Technique). Он включает в себя три основных этапа:
1. **Низкоранговая представление данных**: для каждого батча данных GRAFT извлекает низкоранговую отображение, сохраняя ключевые особенности батча.
2. **Динамическое выборение подмножеств**: используя Fast MaxVol sampler, GRAFT выбирает небольшое, но разнообразное подмножество, которое эффективно охватывает главные направления батча.
3. **Динамическое управление размером подмножества**: GRAFT адаптирует размер подмножества в процессе обучения с использованием критерия, основанного на приближению градиентов.
Эта архитектура позволяет сохранить точность обучения, при этом уменьшая время работы и энергозатраты.
## Результаты
Исследования проводились на нескольких различных бенчмарках, включая изображения, тексты и трехмерные данные. На этих данных GRAFT продемонстрировал похожую точность, и в некоторых случаях даже превосходил популярные методы выбора подмножеств, такие как GradMatch и Coreset. Также были измерены энергоемкость и время выполнения, где GRAFT показал значительные улучшения по сравнению с базовыми методами.
## Значимость
Метод GRAFT может применяться в различных областях, где необходимо эффективное обучение моделей, например, в медицине, автоматическом управлении и транспорта. Он обеспечивает высокую точность с минимальными затратами на вычислительные ресурсы и энергию. Данный подход может существенно снизить энергозатраты и уменьшить время обучения, при этом сохраняя качество результатов.
## Выводы
Предложенная технология GRAFT представляет собой прорыв в динамическом выборе подмножеств для эффективного обучения нейронных сетей. Она позволяет сократить вычислительные затраты и энергоспособность без потери точности. Будущие исследования будут сфокусированы на улучшении GRAFT для приложений в реальном времени и его распространении на широкий круг задач.
Abstract
Training modern neural networks on large datasets is computationally and
environmentally costly. We introduce GRAFT, a scalable in-training subset
selection method that (i) extracts a low-rank feature representation for each
batch, (ii) applies a Fast MaxVol sampler to select a small, diverse subset
that spans the batch's dominant subspace, and (iii) dynamically adjusts the
subset size using a gradient-approximation criterion. By operating in low-rank
subspaces and training on carefully chosen examples instead of full batches,
GRAFT preserves the training trajectory while reducing wall-clock time, energy
consumption, and $\mathrm{CO}_2$ emissions. Across multiple benchmarks, GRAFT
matches or exceeds recent selection baselines in both accuracy and efficiency,
providing a favorable trade-off between accuracy, efficiency, and emissions.