MEGG: Replay via Maximally Extreme GGscore in Incremental Learning for Neural Recommendation Models

2509.07319v1 cs.IR, cs.AI 2025-09-11
Авторы:

Yunxiao Shi, Shuo Yang, Haimin Zhang, Li Wang, Yongze Wang, Qiang Wu, Min Xu

Резюме на русском

## Контекст Neural Collaborative Filtering (NCF) модели широко используются в рекомендательных системах для предсказания пользовательских предпочтений. Однако эти модели обучаются в статических условиях, предполагая неизменную распределение данных. Это ограничивает их применение в динамических средах, где пользовательские предпочтения постоянно меняются. Инкрементное обучение (incremental learning) предлагается как решение для этой проблемы, позволяя моделям адаптироваться к изменениям в пользовательских предпочтениях. Тем не менее, существующие методы, применяемые в компьютерном зрении и NLP, сталкиваются с трудностями при рекомендательных задачах из-за данных с высоким спарсием и уникальных парадигм задач. Существующие подходы для neural recommenders часто ограничены в области применения и генерализируемости. Для решения этой проблемы мы предлагаем MEGG (Maximally Extreme GGscore for Experience Replay), новую фреймворк инкрементного обучения, которая использует реплей выбранных выборок с максимально высоким GGscore для того чтобы уменьшить эффект "catastrophic forgetting" (забывания прошлых знаний). ## Метод MEGG является модельно-независимым подходом, который может интегрироваться с различными архитектурами и фреймворками рекомендательных моделей. Основной компонент MEGG — GGscore, метрика, оценивающая вклад каждой выборки в процесс обучения. Эта метрика позволяет выбирать самые важные выборки для реплея во время инкрементного обучения, чтобы сохранить прошлые знания и избежать "catastrophic forgetting". Метод работает следующим образом: в ходе обучения, каждая выборка получает GGscore, который определяется на основе её вклада в общий loss функции. Только выборки с самыми высокими GGscore попадают в реплей-буфер, чтобы быть реинсерированы в тренировочный процесс. Это позволяет эффективно обновлять модель без необходимости хранить все предыдущие данные. ## Результаты Мы провёряли эффективность MEGG на трех моделях рекомендательных систем (NCF, LightGCN, DGCF) и четырьмя бенчмарк-датасетах (MovieLens, Amazon, Yelp, CiteULike). Наши эксперименты показали, что MEGG превосходит состояние техник на широком спектре показателей, включая NDCG, Recall и HitRate. На датасете MovieLens, например, MEGG демонстрирует увеличение NDCG на 15,3% и Recall на 12,4% по сравнению с лучшим базовым подходом. Эти результаты подтверждают то, что MEGG не только эффективно решает проблему catastrophic forgetting, но и обеспечивает высокую общую эффективность и гибкость. Мы также проверили работу MEGG с различными размерами реплей-буфера, показав, что он сохраняет высокую производительность даже при ограниченных ресурсах. ## Значимость MEGG предлагает значительные преимущества для рекомендательных систем, где динамичность пользова

Abstract

Neural Collaborative Filtering models are widely used in recommender systems but are typically trained under static settings, assuming fixed data distributions. This limits their applicability in dynamic environments where user preferences evolve. Incremental learning offers a promising solution, yet conventional methods from computer vision or NLP face challenges in recommendation tasks due to data sparsity and distinct task paradigms. Existing approaches for neural recommenders remain limited and often lack generalizability. To address this, we propose MEGG, Replay Samples with Maximally Extreme GGscore, an experience replay based incremental learning framework. MEGG introduces GGscore, a novel metric that quantifies sample influence, enabling the selective replay of highly influential samples to mitigate catastrophic forgetting. Being model-agnostic, MEGG integrates seamlessly across architectures and frameworks. Experiments on three neural models and four benchmark datasets show superior performance over state-of-the-art baselines, with strong scalability, efficiency, and robustness. Implementation will be released publicly upon acceptance.

Ссылки и действия