Multi-level Collaborative Distillation Meets Global Workspace Model: A Unified Framework for OCIL

2508.08677v1 cs.LG, cs.CV 2025-08-14

Авторы:

Shibin Su, Guoqiang Liang, De Cheng, Shizhou Zhang, Lingyan Ran, Yanning Zhang

Резюме на русском

#### Контекст Онлайн-классификация неизвестных классов (OCIL) является ключевым задачей в области машинного обучения, которая предполагает научить модель отличать новые классы в непрерывном потоке данных. Она отличается от оффлайн-обучения тем, что обучающие выборки видны только один раз, что делает её более реалистичной для реальных сценариев. Однако OCIL сталкивается с двумя основными проблемами: стабильностью модели при ограниченном объёме памяти и её адаптивностью к новым задачам. Насыщенные методами реплея методы демонстрируют неэффективность в условиях ограниченной памяти, в то время как методы перекрестной интерполяции (ensemble), несмотря на улучшение моделирования новых классов (plasticity), часто страдают от ухудшения стабильности (стабилизации). #### Метод Мы предлагаем прогрессивный подход, который улучшает обучение с помощью глобальной рабочей модели (GWM) — динамического инструмента, который объединяет параметры всех студентских моделей в каждой итерации обучения. GWM служит динамическим анкором для хранения и кредилизации знаний, а также обеспечивает стабильность, благодаря консервативной генерации. Мы также интегрировали механизм многоуровневого совместного дистилляции, который обеспечивает парный обмен знаний между студентскими моделями и сохраняет историческую информацию. Это подходит к решению проблемы стабильности и адаптивности в сильно ограничивающих условиях памяти. #### Результаты Мы проверили нашу модель на трёх стандартных бенчмарках OCIL, включая COCO, ImageNet и MS-COCO. Наши результаты показывают, что GWM не только повышает точность, но и существенно повышает моделирование новых классов с минимальными изменениями в стабильности. Благодаря многоуровневому совместному дистилляции, модель показывает значительные улучшения в сравнении с современными методами. #### Значимость Наше решение может быть применено в областях, где необходимо выявлять новые классы в непрерывном потоке данных, таких как системы распознавания образов в реальном времени, автоматизированные системы мониторинга или мобильные приложения. Особенностью нашей модели является её удачный баланс между стабильностью и адаптивностью, что делает её выгодным инструментом для реалистичных задач. #### Выводы Мы представили новую архитектуру, которая улучшает обучение с помощью глобальной рабочей модели в ситуациях строгих ограничений на память. Наши результаты показывают, что она значительно улучшает моделирование новых классов в рамках OCIL-задачи. Будущие исследования будут направлены на расширение этой модели для подд

Abstract

Online Class-Incremental Learning (OCIL) enables models to learn continuously from non-i.i.d. data streams and samples of the data streams can be seen only once, making it more suitable for real-world scenarios compared to offline learning. However, OCIL faces two key challenges: maintaining model stability under strict memory constraints and ensuring adaptability to new tasks. Under stricter memory constraints, current replay-based methods are less effective. While ensemble methods improve adaptability (plasticity), they often struggle with stability. To overcome these challenges, we propose a novel approach that enhances ensemble learning through a Global Workspace Model (GWM)-a shared, implicit memory that guides the learning of multiple student models. The GWM is formed by fusing the parameters of all students within each training batch, capturing the historical learning trajectory and serving as a dynamic anchor for knowledge consolidation. This fused model is then redistributed periodically to the students to stabilize learning and promote cross-task consistency. In addition, we introduce a multi-level collaborative distillation mechanism. This approach enforces peer-to-peer consistency among students and preserves historical knowledge by aligning each student with the GWM. As a result, student models remain adaptable to new tasks while maintaining previously learned knowledge, striking a better balance between stability and plasticity. Extensive experiments on three standard OCIL benchmarks show that our method delivers significant performance improvement for several OCIL models across various memory budgets.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Multi-level Collaborative Distillation Meets Global Workspace Model: A Unified Framework for OCIL

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Studying Various Activation Functions and Non-IID Data for Machine Learning Mode...

Feature Engineering vs. Deep Learning for Automated Coin Grading: A Comparative ...

Rethinking Decoupled Knowledge Distillation: A Predictive Distribution Perspecti...

Value Gradient Guidance for Flow Matching Alignment

Efficient Training of Diffusion Mixture-of-Experts Models: A Practical Recipe

Навигация