Global Pre-fixing, Local Adjusting: A Simple yet Effective Contrastive Strategy for Continual Learning
2509.15347v1
cs.LG, cs.CV
2025-09-23
Авторы:
Jia Tang, Xinrui Wang, Songcan Chen
Резюме на русском
#### Контекст
Continual learning (CL) является ключевым заданием в машинном обучении, нацеленным на уменьшение проблемы катастрофического забывания. Эта проблема возникает при обучении модели на ряде задач, когда она забывает ранее полученные знания. Одним из перспективных подходов в CL является использование contrastive loss для создания более трансферабельных и менее забывающихся представлений. Однако, существующие методы сталкиваются с проблемами разделения интер-задачных и интра-задачных признаков, что приводит к повышенной степени забывания и неточности. Данная статья предлагает новую стратегию, которая адресует эти проблемы, обеспечивая более точное разделение и трансформацию представлений.
#### Метод
Метод \textbf{G}lobal \textbf{P}re-fixing, \textbf{L}ocal \textbf{A}djusting for \textbf{S}upervised \textbf{C}ontrastive learning (GPLASC) основывается на двух основных компонентах: **глобальном префиксинге** и **локальной регулировке**. Глобальный префиксинг разбивает пространство представлений на непересекающиеся области, каждая из которых сформирована по точечной схеме, образующей **E**quiangular **T**ight **F**rame (ETF). Эти области делятся между задачами, чтобы избежать интер-задачной путаницы. Локальная регулировка, в свою очередь, регулирует внутризадачные признаки, образуя индивидуальные локальные ETF-фреймы в рамках предварительно определенной области. Таким образом, GPLASC обеспечивает возможность разделять и отличать признаки как между задачами, так и внутри задач. Этот подход легко интегрируется с существующими CL-фреймворками.
#### Результаты
Чтобы проверить эффективность GPLASC, проводились ряд экспериментов на широко известных базах данных для CL, включая Split-CIFAR-100 и Split-MiniImagenet. Мы сравнивали нашу стратегию с несколькими современными методами CL, включая подходы, основанные на contrastive loss. Результаты показали, что GPLASC превосходит другие методы в терминах метрик качества, таких как average accuracy и forgetting rate. Эти результаты доказывают, что наш подход эффективно решает проблему забывания и сохраняет высокую точность в CL-задачах.
#### Значимость
Предложенная стратегия GPLASC может быть применена в различных CL-ситуациях, включая образовательные системы, робототехнику и анализ данных в реальном времени. Основные преимущества заключаются в высокой точности, уменьшении забывания и уменьшении конфузионирования между задачами. Будущие исследования будут сосредоточены на улучшении адаптации GPLASC к более сложным задачам и его интеграции с другими CL-методами.
#### Выводы
В этой работе мы предложили новую стратегию GPLASC для решения проблемы забывания в CL. Мы демонстрируем, что наш подход эффектив
Abstract
Continual learning (CL) involves acquiring and accumulating knowledge from
evolving tasks while alleviating catastrophic forgetting. Recently, leveraging
contrastive loss to construct more transferable and less forgetful
representations has been a promising direction in CL. Despite advancements,
their performance is still limited due to confusion arising from both
inter-task and intra-task features. To address the problem, we propose a simple
yet effective contrastive strategy named \textbf{G}lobal \textbf{P}re-fixing,
\textbf{L}ocal \textbf{A}djusting for \textbf{S}upervised \textbf{C}ontrastive
learning (GPLASC). Specifically, to avoid task-level confusion, we divide the
entire unit hypersphere of representations into non-overlapping regions, with
the centers of the regions forming an inter-task pre-fixed \textbf{E}quiangular
\textbf{T}ight \textbf{F}rame (ETF). Meanwhile, for individual tasks, our
method helps regulate the feature structure and form intra-task adjustable ETFs
within their respective allocated regions. As a result, our method
\textit{simultaneously} ensures discriminative feature structures both between
tasks and within tasks and can be seamlessly integrated into any existing
contrastive continual learning framework. Extensive experiments validate its
effectiveness.
Ссылки и действия
Дополнительные ресурсы: