GRAFT: Gradient-Aware Fast MaxVol Technique for Dynamic Data Sampling

2508.13653v1 cs.LG, cs.AI, cs.NA, math.NA 2025-08-21

Авторы:

Ashish Jha, Anh huy Phan, Razan Dibo, Valentin Leplat

Резюме на русском

## Контекст Современные нейронные сети требуют большого объема вычислительных ресурсов и энергии для обучения, особенно при работе с огромными данными. Это приводит к повышенным экономическим и экологическим затратам. Одной из проблем является эффективное выборение подмножества данных для обучения, которое позволило бы сократить время обучения и энергоспособность без существенного ухудшения точности модели. Данная работа адресует эту проблему, предложив новую методику для динамического выбора подмножеств данных в ходе обучения. ## Метод Метод, предлагаемый в работе, называется **GRAFT** (Gradient-Aware Fast MaxVol Technique). Он включает в себя три основных этапа: 1. **Низкоранговая представление данных**: для каждого батча данных GRAFT извлекает низкоранговую отображение, сохраняя ключевые особенности батча. 2. **Динамическое выборение подмножеств**: используя Fast MaxVol sampler, GRAFT выбирает небольшое, но разнообразное подмножество, которое эффективно охватывает главные направления батча. 3. **Динамическое управление размером подмножества**: GRAFT адаптирует размер подмножества в процессе обучения с использованием критерия, основанного на приближению градиентов. Эта архитектура позволяет сохранить точность обучения, при этом уменьшая время работы и энергозатраты. ## Результаты Исследования проводились на нескольких различных бенчмарках, включая изображения, тексты и трехмерные данные. На этих данных GRAFT продемонстрировал похожую точность, и в некоторых случаях даже превосходил популярные методы выбора подмножеств, такие как GradMatch и Coreset. Также были измерены энергоемкость и время выполнения, где GRAFT показал значительные улучшения по сравнению с базовыми методами. ## Значимость Метод GRAFT может применяться в различных областях, где необходимо эффективное обучение моделей, например, в медицине, автоматическом управлении и транспорта. Он обеспечивает высокую точность с минимальными затратами на вычислительные ресурсы и энергию. Данный подход может существенно снизить энергозатраты и уменьшить время обучения, при этом сохраняя качество результатов. ## Выводы Предложенная технология GRAFT представляет собой прорыв в динамическом выборе подмножеств для эффективного обучения нейронных сетей. Она позволяет сократить вычислительные затраты и энергоспособность без потери точности. Будущие исследования будут сфокусированы на улучшении GRAFT для приложений в реальном времени и его распространении на широкий круг задач.

Abstract

Training modern neural networks on large datasets is computationally and environmentally costly. We introduce GRAFT, a scalable in-training subset selection method that (i) extracts a low-rank feature representation for each batch, (ii) applies a Fast MaxVol sampler to select a small, diverse subset that spans the batch's dominant subspace, and (iii) dynamically adjusts the subset size using a gradient-approximation criterion. By operating in low-rank subspaces and training on carefully chosen examples instead of full batches, GRAFT preserves the training trajectory while reducing wall-clock time, energy consumption, and $\mathrm{CO}_2$ emissions. Across multiple benchmarks, GRAFT matches or exceeds recent selection baselines in both accuracy and efficiency, providing a favorable trade-off between accuracy, efficiency, and emissions.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

GRAFT: Gradient-Aware Fast MaxVol Technique for Dynamic Data Sampling

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

KAN-GCN: Combining Kolmogorov-Arnold Network with Graph Convolution Network for ...

STNet: Spectral Transformation Network for Solving Operator Eigenvalue Problem

Accelerating Eigenvalue Dataset Generation via Chebyshev Subspace Filter

Unveiling the Power of Multiple Gossip Steps: A Stability-Based Generalization A...

Generalized Orders of Magnitude for Scalable, Parallel, High-Dynamic-Range Compu...

Навигация