CORE-ReID V2: Advancing the Domain Adaptation for Object Re-Identification with Optimized Training and Ensemble Fusion

2508.04036v1 cs.CV, cs.AI 2025-08-09

Авторы:

Trinh Quoc Nguyen, Oky Dicky Ardiansyah Prima, Syahid Al Irfan, Hindriyanto Dwi Purnomo, Radius Tanone

Резюме на русском

## КОНТЕКСТ И ПРОБЛЕМАТИКА Область Object Re-Identification (ReID) — одна из ключевых задач в компьютерном зрении, которая нацелена на идентификацию объектов, таких как люди или автомобили, на различных камерах или в разных сценариях. Несмотря на значительные успехи в этой области, решение задач ReID остается сложной задачей, особенно в контексте Unsupervised Domain Adaptation (UDA). Традиционные подходы к ReID часто страдают от проблемы доменной разницы, когда модели, обученные на одном наборе данных, не эффективно работают на другом из-за различий в распределении данных. Это особенно актуально для практических приложений, где данные могут быть собраны в различных условиях, таких как разные местоположения, освещение или ракурсы. Проблема UDA в ReID заключается в том, чтобы адаптировать модель, обученную на исходном домене (source domain), к новому, целевому домену (target domain), где метки данных недоступны. Это требует разработки эффективных методов для борьбы с проблемами различий в данных и генерации качественных представлений объектов. Кроме того, многие существующие решения страдают от недостатков в точности и сложности, что ограничивает их применимость в реальных сценариях. В этом контексте, CORE-ReID V2 предлагает улучшенный подход, который стремится решить эти проблемы, используя расширенные методы предобработки данных, улучшенную архитектуру модели и эффективные механизмы фьюзинга для повышения точности и эффективности ReID в различных доменах. ## ПРЕДЛОЖЕННЫЙ МЕТОД CORE-ReID V2 — это усовершенствованный фреймворк, который строится на основе предшественника CORE-ReID, но включает в себя несколько ключевых улучшений для решения проблем UDA в Object ReID. Основным компонентом этого фреймворка является использование CycleGAN для синтеза данных в процессе предобработки. CycleGAN позволяет генерировать синтетические изображения, которые помогают переносить характеристики изображений из исходного домена в целевой, тем самым снижая разрыв между распределениями данных. Во время файн-тюнинга, CORE-ReID V2 использует совершенствованный механизм ensemble fusion, который состоит из Efficient Channel Attention Block (ECAB) и Simplified Efficient Channel Attention Block (SECAB). Эти блоки позволяют эффективно обрабатывать как локальные, так и глобальные функции представлений объектов, что помогает уменьшить неопределенность в псевдо-метках для целевых образцов. ECAB и SECAB обеспечивают более глубокое понимание данных, улучшая качество представлений и повышая точность классификации. Архитектура CORE-ReID V2 также поддерживает легковесные бэкбоны, такие как ResNet18 и ResNet34, что делает его более эффективным с точки зрения вычислительных ресурсов. Это позволяет фреймворку быть более масштабируемым и пригодным для различных практических приложений. ## ЭКСПЕРИМЕНТАЛЬНЫЕ РЕЗУЛЬТАТЫ Для оценки эффективности CORE-ReID V2 проведены эксперименты на различных наборах данных, включая UDA Person ReID и Vehicle ReID. Результаты демонстрируют, что CORE-ReID V2 значительно превосходит современные методы по ключевым метрикам, таким как Mean Average Precision (mAP) и Rank-k Accuracy (Top-1, Top-5, Top-10). Например, на некоторых наборах данных, CORE-ReID V2 достигает высочайших показателей mAP и Rank-1 Accuracy, что подтверждает его лидирующую позицию среди современных подходов. В экспериментах также было показано, что использование CycleGAN для синтеза данных в предобработке существенно повышает качество адаптации модели к новым доменам. Благодаря эффективным механизмам фьюзинга, CORE-ReID V2 успешно справляется с неопределенностью в псевдо-метках, что является ключевым фактором для достижения высокой точности. ## ПРАКТИЧЕСКАЯ ЗНАЧИМОСТЬ CORE-ReID V2 имеет широкий спектр применений в различных областях, включая безопасность, транспорт и розничную торговлю. Благодаря его способности эффективно адаптироваться к различным доменам, этот фреймворк может быть использован для решения задач ReID в реальных условиях, где данные могут быть получены из различных источников. Преимущества CORE-ReID V2 включают в себя не только высокую точность и эффективность, но и масштабируемость благодаря поддержке легковесных бэкбонов. Это делает его пригодным для использования на различных платформах, включая мобильные устройства. ## ВЫВОДЫ И ПЕРСПЕКТИВЫ CORE-ReID V2 является значительным шагом вперед в области Unsupervised Domain Adaptation для Object ReID. Он не только показывает высокую эффективность на различных наборах данных, но и открывает новые возможности для дальнейших исследований в этой области. Будущие исследования могут фокусироваться на дальнейшем улучшении архитектуры, включая использование более продвинутых моделей и методов для еще более эффективной адаптации к новым доменам. Открытый код и модели также позволят другим исследователям продолжить работу над улучшением этого фреймворка.

Abstract

This study presents CORE-ReID V2, an enhanced framework building upon CORE-ReID. The new framework extends its predecessor by addressing Unsupervised Domain Adaptation (UDA) challenges in Person ReID and Vehicle ReID, with further applicability to Object ReID. During pre-training, CycleGAN is employed to synthesize diverse data, bridging image characteristic gaps across different domains. In the fine-tuning, an advanced ensemble fusion mechanism, consisting of the Efficient Channel Attention Block (ECAB) and the Simplified Efficient Channel Attention Block (SECAB), enhances both local and global feature representations while reducing ambiguity in pseudo-labels for target samples. Experimental results on widely used UDA Person ReID and Vehicle ReID datasets demonstrate that the proposed framework outperforms state-of-the-art methods, achieving top performance in Mean Average Precision (mAP) and Rank-k Accuracy (Top-1, Top-5, Top-10). Moreover, the framework supports lightweight backbones such as ResNet18 and ResNet34, ensuring both scalability and efficiency. Our work not only pushes the boundaries of UDA-based Object ReID but also provides a solid foundation for further research and advancements in this domain. Our codes and models are available at https://github.com/TrinhQuocNguyen/CORE-ReID-V2.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

CORE-ReID V2: Advancing the Domain Adaptation for Object Re-Identification with Optimized Training and Ensemble Fusion

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Dual-Stream Spectral Decoupling Distillation for Remote Sensing Object Detection

Explainable Parkinsons Disease Gait Recognition Using Multimodal RGB-D Fusion an...

GuidNoise: Single-Pair Guided Diffusion for Generalized Noise Synthesis

PhyVLLM: Physics-Guided Video Language Model with Motion-Appearance Disentanglem...

Detection of Intoxicated Individuals from Facial Video Sequences via a Recurrent...

Навигация