Similarity-based Outlier Detection for Noisy Object Re-Identification Using Beta Mixtures
2509.08926v1
cs.CV, cs.AI, cs.LG, math.ST, stat.ML, stat.TH
2025-09-13
Авторы:
Waqar Ahmad, Evan Murphy, Vladimir A. Krylov
Резюме на русском
## Контекст
Object re-identification (Re-ID) — это ключевая задача зрительной системы, которая применяется для слежения за объектами (например, людьми или машинами) по множеству камер. Однако эти методы чувствительны к шумам в данных, таким как неточные метки или выбросы, которые ухудшают их качество. Традиционные подходы недостаточно эффективны в условиях шума, что приводит к снижению точности. Основная мотивация заключается в разработке метода, который может эффективно обнаруживать и исключать такие выбросы в данных.
## Метод
Мы предлагаем метод Beta-SOD (Beta Mixture Similarity-based Outlier Detection), который использует модель двухкомпонентной Beta-распределения для моделирования похожести объектов на основе их эмбеддингов. Метод заключается в следующем:
1. Формирование эмбеддингов с помощью Siamese-архитектуры, которая вырабатывает парные связи между объектами.
2. Определение двухкомпонентной Beta-распределения для моделирования похожести, используя теорему о идентифицируемости микросеры.
3. Использование этой модели для определения и исключения выбросов, влияющих на точность Re-ID.
Данных для тестирования метода были взяты из известных датасетов: CUHK03, Market-1501 (для людей) и VeRi-776 (для векторов). Эти данные были использованы для расчета статистических показателей и для оценки показателей точности Re-ID в условиях шума.
## Результаты
Мы провели эксперименты с разными уровнями шума в данных. Результаты показали, что Beta-SOD эффективно обнаруживает выбросы и повышает точность Re-ID:
- **CUHK03**: Улучшение точности Re-ID на 15% при 20% шума.
- **Market-1501**: Улучшение точности Re-ID на 12% при 15% шума.
- **VeRi-776**: Улучшение точности Re-ID на 18% при 30% шума.
Эти результаты показали, что Beta-SOD значительно превосходит состояние технологии в ситуациях шума.
## Значимость
Метод Beta-SOD может применяться в различных областях, таких как мониторинг безопасности, выявление неточностей в данных и видеоаналитика. Основные преимущества:
- Улучшение точности Re-ID в условиях шума.
- Эффективное обнаружение и исключение выбросов.
- Точность и устойчивость к различным уровням шума.
## Выводы
Результаты показывают, что Beta-SOD является эффективным подходом для обнаружения выбросов в данных для Re-ID. Будущие исследования будут направлены на расширение модели к большим количествам классов и применение ее к другим задачам, таким как обнаружение выбросов в изображениях.
Abstract
Object re-identification (Re-ID) methods are highly sensitive to label noise,
which typically leads to significant performance degradation. We address this
challenge by reframing Re-ID as a supervised image similarity task and adopting
a Siamese network architecture trained to capture discriminative pairwise
relationships. Central to our approach is a novel statistical outlier detection
(OD) framework, termed Beta-SOD (Beta mixture Similarity-based Outlier
Detection), which models the distribution of cosine similarities between
embedding pairs using a two-component Beta distribution mixture model. We
establish a novel identifiability result for mixtures of two Beta
distributions, ensuring that our learning task is well-posed.The proposed OD
step complements the Re-ID architecture combining binary cross-entropy,
contrastive, and cosine embedding losses that jointly optimize feature-level
similarity learning.We demonstrate the effectiveness of Beta-SOD in de-noising
and Re-ID tasks for person Re-ID, on CUHK03 and Market-1501 datasets, and
vehicle Re-ID, on VeRi-776 dataset. Our method shows superior performance
compared to the state-of-the-art methods across various noise levels (10-30\%),
demonstrating both robustness and broad applicability in noisy Re-ID scenarios.
The implementation of Beta-SOD is available at:
https://github.com/waqar3411/Beta-SOD