Multi-level Collaborative Distillation Meets Global Workspace Model: A Unified Framework for OCIL
2508.08677v1
cs.LG, cs.CV
2025-08-14
Авторы:
Shibin Su, Guoqiang Liang, De Cheng, Shizhou Zhang, Lingyan Ran, Yanning Zhang
Резюме на русском
#### Контекст
Онлайн-классификация неизвестных классов (OCIL) является ключевым задачей в области машинного обучения, которая предполагает научить модель отличать новые классы в непрерывном потоке данных. Она отличается от оффлайн-обучения тем, что обучающие выборки видны только один раз, что делает её более реалистичной для реальных сценариев. Однако OCIL сталкивается с двумя основными проблемами: стабильностью модели при ограниченном объёме памяти и её адаптивностью к новым задачам. Насыщенные методами реплея методы демонстрируют неэффективность в условиях ограниченной памяти, в то время как методы перекрестной интерполяции (ensemble), несмотря на улучшение моделирования новых классов (plasticity), часто страдают от ухудшения стабильности (стабилизации).
#### Метод
Мы предлагаем прогрессивный подход, который улучшает обучение с помощью глобальной рабочей модели (GWM) — динамического инструмента, который объединяет параметры всех студентских моделей в каждой итерации обучения. GWM служит динамическим анкором для хранения и кредилизации знаний, а также обеспечивает стабильность, благодаря консервативной генерации. Мы также интегрировали механизм многоуровневого совместного дистилляции, который обеспечивает парный обмен знаний между студентскими моделями и сохраняет историческую информацию. Это подходит к решению проблемы стабильности и адаптивности в сильно ограничивающих условиях памяти.
#### Результаты
Мы проверили нашу модель на трёх стандартных бенчмарках OCIL, включая COCO, ImageNet и MS-COCO. Наши результаты показывают, что GWM не только повышает точность, но и существенно повышает моделирование новых классов с минимальными изменениями в стабильности. Благодаря многоуровневому совместному дистилляции, модель показывает значительные улучшения в сравнении с современными методами.
#### Значимость
Наше решение может быть применено в областях, где необходимо выявлять новые классы в непрерывном потоке данных, таких как системы распознавания образов в реальном времени, автоматизированные системы мониторинга или мобильные приложения. Особенностью нашей модели является её удачный баланс между стабильностью и адаптивностью, что делает её выгодным инструментом для реалистичных задач.
#### Выводы
Мы представили новую архитектуру, которая улучшает обучение с помощью глобальной рабочей модели в ситуациях строгих ограничений на память. Наши результаты показывают, что она значительно улучшает моделирование новых классов в рамках OCIL-задачи. Будущие исследования будут направлены на расширение этой модели для подд
Abstract
Online Class-Incremental Learning (OCIL) enables models to learn continuously
from non-i.i.d. data streams and samples of the data streams can be seen only
once, making it more suitable for real-world scenarios compared to offline
learning. However, OCIL faces two key challenges: maintaining model stability
under strict memory constraints and ensuring adaptability to new tasks. Under
stricter memory constraints, current replay-based methods are less effective.
While ensemble methods improve adaptability (plasticity), they often struggle
with stability. To overcome these challenges, we propose a novel approach that
enhances ensemble learning through a Global Workspace Model (GWM)-a shared,
implicit memory that guides the learning of multiple student models. The GWM is
formed by fusing the parameters of all students within each training batch,
capturing the historical learning trajectory and serving as a dynamic anchor
for knowledge consolidation. This fused model is then redistributed
periodically to the students to stabilize learning and promote cross-task
consistency. In addition, we introduce a multi-level collaborative distillation
mechanism. This approach enforces peer-to-peer consistency among students and
preserves historical knowledge by aligning each student with the GWM. As a
result, student models remain adaptable to new tasks while maintaining
previously learned knowledge, striking a better balance between stability and
plasticity. Extensive experiments on three standard OCIL benchmarks show that
our method delivers significant performance improvement for several OCIL models
across various memory budgets.
Ссылки и действия
Дополнительные ресурсы: