Unified Knowledge Distillation Framework: Fine-Grained Alignment and Geometric Relationship Preservation for Deep Face Recognition

2508.11376v1 cs.CV, cs.LG 2025-08-19
Авторы:

Durgesh Mishra, Rishabh Uikey

Резюме на русском

## Контекст Классификация лиц – одна из самых важных задач в области обработки изображений. На устройствах с ограниченными ресурсами, таких как мобильные телефоны или IoT-устройства, требуется оптимизация моделей для эффективного распознавания лиц. Одним из распространенных подходов является Knowledge Distillation (KD), при котором учеником (student) является модель с меньшим размером и сложностью, которая учится от преподавателя (teacher) – более сложной модели. Однако, традиционные методы KD, такие как Raw L2 Feature Distillation и Feature Consistency loss, часто не могут полностью хвататься тонких деталей индивидуальных примеров и сложных отношений между образами. Это приводит к затруднениям в достижении высокой точности на устройствах с ограниченными ресурсами. ## Метод Мы предлагаем Unified Knowledge Distillation Framework, который объединяет два новых подхода к распространенным проблемам при распределении знаний. Первый, **Instance-Level Embedding Distillation**, ориентирован на тонкую характеристику индивидуальных примеров. Он использует динамическую стратегию hard mining для выделения сложных примеров, что позволяет улучшить алгоритм обучения. Другой, **Relation-Based Pairwise Similarity Distillation**, заключается в привлечении отношений между примерами. Он использует механизм memory bank для хранения информации о парах примеров и стратегию sample mining для выделения ключевых отношений. Этот комплексный подход обеспечивает эффективное взаимодействие между отдельными примерами и их отношениями, что приводит к более точному распределению знаний и высокой точности распознавания. ## Результаты Мы проводили эксперименты на нескольких датасетах для распознавания лиц, таких как LFW, CFP-FP и AgeDB-30. Наши результаты показали, что универсальный KD-фреймворк превосходит существующие методы по метрикам точности. Особо заметны улучшения на сложных датасетах, где тонкие детали и отношения между примерами играют ключевую роль. Даже в ситуациях, когда преподаватель модель (teacher) сильнее, тогда ученик (student) может превзойти его, что демонстрирует мощь нашей модели. Эти результаты подтверждают эффективность нашего подхода в рамках распределения знаний для лица. ## Значимость Наш фреймворк может применяться в различных задачах, где необходима эффективная классификация лиц, например, в безопасности, в устройствах для личного идентификации, в системах доступа к данным. Он улучшает точность, сохраняя эффективность, что делает его привлекательным для применения в реальных устройствах. Благодаря взаимодействию между отдельными примерами и их отношениями, наш подход отличается своей глубиной и точностью, что делает его одним из лучших в своем классе. ## Выводы Мы представили новый Unified Knowledge Distillation Framework, который использ

Abstract

Knowledge Distillation is crucial for optimizing face recognition models for deployment in computationally limited settings, such as edge devices. Traditional KD methods, such as Raw L2 Feature Distillation or Feature Consistency loss, often fail to capture both fine-grained instance-level details and complex relational structures, leading to suboptimal performance. We propose a unified approach that integrates two novel loss functions, Instance-Level Embedding Distillation and Relation-Based Pairwise Similarity Distillation. Instance-Level Embedding Distillation focuses on aligning individual feature embeddings by leveraging a dynamic hard mining strategy, thereby enhancing learning from challenging examples. Relation-Based Pairwise Similarity Distillation captures relational information through pairwise similarity relationships, employing a memory bank mechanism and a sample mining strategy. This unified framework ensures both effective instance-level alignment and preservation of geometric relationships between samples, leading to a more comprehensive distillation process. Our unified framework outperforms state-of-the-art distillation methods across multiple benchmark face recognition datasets, as demonstrated by extensive experimental evaluations. Interestingly, when using strong teacher networks compared to the student, our unified KD enables the student to even surpass the teacher's accuracy.

Ссылки и действия