Revisiting Data Attribution for Influence Functions

2508.07297v1 cs.LG, cs.AI 2025-08-13
Авторы:

Hongbo Zhu, Angelo Cangelosi

Резюме на русском

#### Контекст В статье "Revisiting Data Attribution for Influence Functions" авторы исследуют возможности воздействия функций влияния (influence functions) в глубоком обучении. Целью исследования является определение влияния отдельных обучающих примеров на модель, что оказывается ключевым для глубокого понимания модели, дебаггинга данных и улучшения ответственности моделей. Использование функций влияния позволяет эффективно оценить влияние данных на обученные параметры модели без необходимости полного переобучения. Эта тема становится важной в свет растущего интереса к интерпретируемости и ответственности моделей, особенно в применениях с большими объемами данных. #### Метод Авторы применяют теоретические и алгоритмические подходы для исследования воздействия функций влияния в глубоком обучении. Они рассматривают подходы, основанные на робастных статистиках, для эффективного оценивания воздействия отдельных данных на обученные модели. Работа также исследует алгоритмические усовершенствования для точного вычисления производных, таких как обратные произведения Хессиана. Архитектура исследования основывается на анализе теоретической основы и практического применения функций влияния в глубоком обучении, включая оценку их эффективности в распознавании неверно отбеленных данных. #### Результаты Авторы проводят эксперименты для оценки эффективности функций влияния в различных сценариях, таких как машинное обучение с большими данными. Они применяют алгоритмы для вычисления влияния отдельных обучающих примеров на модель и проверяют их точность в распознавании неверно отбеленных примеров. Результаты показывают, что функции влияния эффективны в обнаружении и исправлении ошибок в данных, при этом обеспечивая высокую скорость и точность. #### Значимость Исследование имеет значительное значение в области интерпретируемости глубокого обучения и дебаггинга данных. Авторы показывают, как функции влияния могут быть использованы для распознавания неверно отбеленных данных и улучшения моделей. Эти технологии могут применяться в различных сценариях, таких как мобильные приложения, интернет-платформы и бизнес-системы, где требуется высокая точность и ответственность моделей. Алгоритмы, описанные в статье, могут способствовать улучшению интеллектуальных систем. #### Выводы В статье достигнуты важные достижения в исследовании влияния функций влияния на модели глубокого обучения. Авторы подчеркивают, что эти функции могут быть применены для улучшения интерпретируемости моделей, дебаггинга данных и улучшения ответственности моделей. Будущие исследования будут сфокусированы на расши

Abstract

The goal of data attribution is to trace the model's predictions through the learning algorithm and back to its training data. thereby identifying the most influential training samples and understanding how the model's behavior leads to particular predictions. Understanding how individual training examples influence a model's predictions is fundamental for machine learning interpretability, data debugging, and model accountability. Influence functions, originating from robust statistics, offer an efficient, first-order approximation to estimate the impact of marginally upweighting or removing a data point on a model's learned parameters and its subsequent predictions, without the need for expensive retraining. This paper comprehensively reviews the data attribution capability of influence functions in deep learning. We discuss their theoretical foundations, recent algorithmic advances for efficient inverse-Hessian-vector product estimation, and evaluate their effectiveness for data attribution and mislabel detection. Finally, highlighting current challenges and promising directions for unleashing the huge potential of influence functions in large-scale, real-world deep learning scenarios.

Ссылки и действия