C${}^2$Prompt: Class-aware Client Knowledge Interaction for Federated Continual Learning
2509.19674v1
cs.LG, cs.CV
2025-09-26
Авторы:
Kunlun Xu, Yibo Feng, Jiangmeng Li, Yongsheng Qi, Jiahuan Zhou
Резюме на русском
#### Контекст
Federated continual learning (FCL) является ключевым подходом для обучения моделей в сценариях, где данные поступают непрерывно с распределенных клиентов. Основная проблема FCL состоит в том, чтобы уменьшить влияние "забывания" (forgetting) — как временного (когда модель забывает ранее обученные знания), так и пространственного (когда модель забывает знания, связанные с конкретными клиентами). Несмотря на развитие методов FCL, проблема классовой когерентности во время обмена знаниями между клиентами остается недостаточно изученной. Эта некогерентность влияет на качество вывода модели и ухудшает постоянство знаний в пространстве и времени.
#### Метод
Мы предлагаем Class-aware Client Knowledge Interaction (C${}^2$Prompt) — метод, который акцентирует внимание на проблеме классовой когерентности в FCL. Метод включает две основные составляющие:
1. **Local Class Distribution Compensation (LCDC)** — метод, который уменьшает различия в классовой распределенности между клиентами, что повышает согласованность внутри класса.
2. **Class-aware Prompt Aggregation (CPA)** — метод, который способствует увеличению релевантности классов во время обмена предложениями (prompts), что уменьшает кросс-классовую путаницу.
C${}^2$Prompt интегрирует эти компоненты в структуре обмена знаниями, улучшая общую эффективность обучения.
#### Результаты
Мы провели эксперименты на нескольких FCL-benchmarks, включая CIFAR-100 и Tiny-ImageNet. Результаты показывают, что C${}^2$Prompt значительно превосходит существующие методы, обеспечивая лучшую точность и постоянство знаний. Мы также проверили эффективность отдельных компонентов C${}^2$Prompt, показав, что оба составляющие — LCDC и CPA — значительно влияют на полученные результаты.
#### Значимость
C${}^2$Prompt может быть применен в сценариях, где необходимо постоянно обучать модели на нестабильных данных с распределенных клиентов. Например, это может быть применение в мобильных приложениях, где каждый пользователь постоянно получает новые данные. Решение предоставляет выгоды в виде улучшенной точности, сохранения знаний с обучения ранее, и значительного сокращения влияния "забывания". Это может привести к более стабильным и эффективным решениям в области распределенного обучения.
#### Выводы
Мы установили новый состояний лучшего результата в области классовой когерентности в FCL. Наш метод, C${}^2$Prompt, выдает значительные улучшения по отношению к ранее предложенным методам. Будущие исследования будут нацелены на улучшение интеграции C${}^2$Prompt в более сложных сценариях FCL, в том числе с нелинейными структурами данных и более высокой многомерностью классов.
Abstract
Federated continual learning (FCL) tackles scenarios of learning from
continuously emerging task data across distributed clients, where the key
challenge lies in addressing both temporal forgetting over time and spatial
forgetting simultaneously. Recently, prompt-based FCL methods have shown
advanced performance through task-wise prompt communication.In this study, we
underscore that the existing prompt-based FCL methods are prone to class-wise
knowledge coherence between prompts across clients. The class-wise knowledge
coherence includes two aspects: (1) intra-class distribution gap across
clients, which degrades the learned semantics across prompts, (2) inter-prompt
class-wise relevance, which highlights cross-class knowledge confusion. During
prompt communication, insufficient class-wise coherence exacerbates knowledge
conflicts among new prompts and induces interference with old prompts,
intensifying both spatial and temporal forgetting. To address these issues, we
propose a novel Class-aware Client Knowledge Interaction (C${}^2$Prompt) method
that explicitly enhances class-wise knowledge coherence during prompt
communication. Specifically, a local class distribution compensation mechanism
(LCDC) is introduced to reduce intra-class distribution disparities across
clients, thereby reinforcing intra-class knowledge consistency. Additionally, a
class-aware prompt aggregation scheme (CPA) is designed to alleviate
inter-class knowledge confusion by selectively strengthening class-relevant
knowledge aggregation. Extensive experiments on multiple FCL benchmarks
demonstrate that C${}^2$Prompt achieves state-of-the-art performance. Our
source code is available at
https://github.com/zhoujiahuan1991/NeurIPS2025-C2Prompt
Ссылки и действия
Дополнительные ресурсы: