CORE-ReID: Comprehensive Optimization and Refinement through Ensemble fusion in Domain Adaptation for person re-identification
2508.03064v1
cs.CV, cs.AI
2025-08-09
Авторы:
Trinh Quoc Nguyen, Oky Dicky Ardiansyah Prima, Katsuyoshi Hotta
Резюме на русском
Person Re-identification (ReID) в условиях Unsupervised Domain Adaptation (UDA) остается вызовом из-за искажений в изображениях, возникающих при использовании различных камер. Для решения этой проблемы предлагается CORE-ReID — фреймворк, объединяющий подходы к оптимизации и рефинингу через пакетное обучение с использованием Ensemble Fusion. Трех этапный подход включает предварительное обучение с CycleGAN для генерации разнообразных данных, корректировку с использованием нескольких видов признаков, а также новый механизм Ensemble Fusion для уточненного использования местных деталей в глобальных признаках. Это позволяет избежать неоднозначности в кластеризации и улучшить точность. Тестирование на трех UDA-выборках показало, что CORE-ReID превосходит современные методы по таким метрикам, как Mean Average Precision, Top-1, Top-5 и Top-10. Наши результаты и модели доступны по ссылке [https://github.com/TrinhQuocNguyen/CORE-ReID].
Abstract
This study introduces a novel framework, "Comprehensive Optimization and
Refinement through Ensemble Fusion in Domain Adaptation for Person
Re-identification (CORE-ReID)", to address an Unsupervised Domain Adaptation
(UDA) for Person Re-identification (ReID). The framework utilizes CycleGAN to
generate diverse data that harmonizes differences in image characteristics from
different camera sources in the pre-training stage. In the fine-tuning stage,
based on a pair of teacher-student networks, the framework integrates
multi-view features for multi-level clustering to derive diverse pseudo labels.
A learnable Ensemble Fusion component that focuses on fine-grained local
information within global features is introduced to enhance learning
comprehensiveness and avoid ambiguity associated with multiple pseudo-labels.
Experimental results on three common UDAs in Person ReID demonstrate
significant performance gains over state-of-the-art approaches. Additional
enhancements, such as Efficient Channel Attention Block and Bidirectional Mean
Feature Normalization mitigate deviation effects and adaptive fusion of global
and local features using the ResNet-based model, further strengthening the
framework. The proposed framework ensures clarity in fusion features, avoids
ambiguity, and achieves high ac-curacy in terms of Mean Average Precision,
Top-1, Top-5, and Top-10, positioning it as an advanced and effective solution
for the UDA in Person ReID. Our codes and models are available at
https://github.com/TrinhQuocNguyen/CORE-ReID.
Ссылки и действия
Дополнительные ресурсы: