From Detection to Correction: Backdoor-Resilient Face Recognition via Vision-Language Trigger Detection and Noise-Based Neutralization
2508.05409v1
cs.CV, cs.SD, eess.AS
2025-08-09
Авторы:
Farah Wahida, M. A. P. Chamikara, Yashothara Shanmugarasa, Mohan Baruwal Chhetri, Thilina Ranbaduge, Ibrahim Khalil
Резюме на русском
Объективная система распознавания лиц на основе глубоких нейронных сетей требует безопасности и достоверности данных. Атаки типа "ловушка" могут подрывать эти системы, внедряя невидимые триггеры в обучающие изображения, что приведет к неправильному распознаванию при аутентификации. Большинство существующих методов защиты против таких атак страдают от неточностей в выявлении зараженных изображений или ухудшении точности распознавания чистых данных. Мы предлагаем новую стратегию TrueBiometric, которая определяет зараженные изображения с помощью механизма опроса, использующего несколько современных языковых-визуальных моделей. Затем, используя целенаправленное добавление шума, эти изображения восстанавливаются без потери качества работы с чистыми данными. Наши эмпирические исследования показали, что TrueBiometric обеспечивает 100% точность в выявлении и исправлении зараженных изображений, демонстрируя превосходство перед альтернативными подходами в области безопасности лицевых систем распознавания.
Abstract
Biometric systems, such as face recognition systems powered by deep neural
networks (DNNs), rely on large and highly sensitive datasets. Backdoor attacks
can subvert these systems by manipulating the training process. By inserting a
small trigger, such as a sticker, make-up, or patterned mask, into a few
training images, an adversary can later present the same trigger during
authentication to be falsely recognized as another individual, thereby gaining
unauthorized access. Existing defense mechanisms against backdoor attacks still
face challenges in precisely identifying and mitigating poisoned images without
compromising data utility, which undermines the overall reliability of the
system. We propose a novel and generalizable approach, TrueBiometric:
Trustworthy Biometrics, which accurately detects poisoned images using a
majority voting mechanism leveraging multiple state-of-the-art large vision
language models. Once identified, poisoned samples are corrected using targeted
and calibrated corrective noise. Our extensive empirical results demonstrate
that TrueBiometric detects and corrects poisoned images with 100\% accuracy
without compromising accuracy on clean images. Compared to existing
state-of-the-art approaches, TrueBiometric offers a more practical, accurate,
and effective solution for mitigating backdoor attacks in face recognition
systems.