Semantic Discrepancy-aware Detector for Image Forgery Identification
2508.12341v1
cs.CV, cs.AI
2025-08-19
Авторы:
Ziye Wang, Minghang Yu, Chunyan Xu, Zhen Cui
Резюме на русском
## Контекст
Современные технологии генерации изображений позволяют создавать реалистичные снимки, что становится вопросом для обеспечения доверия к цифровым медиа. Несанкционированное изменение изображений может привести к серьезным последствиям, включая повреждение репутации индивида или организации. Обнаружение подделок в изображениях является ключевым заданием, требующим внимательного подхода. Несмотря на прогрессы в искусственном интеллекте, существуют проблемы, связанные с несоответствием между пространствами подделок и семантических понятий, что снижает эффективность существующих моделей. Этот факт требует разработки новых подходов, способных лучше интерпретировать формальные и семантические признаки подделок в изображениях.
## Метод
Мы предлагаем метод Semantic Discrepancy-aware Detector (SDD), который оперирует семантическими признаками изображений. Метод основывается на реконструкционном обучении для выравнивания пространств семантических понятий и подделок. В качестве основы используется предварительно обученная модель визионного языкового моделирования. Мы разработали модуль выбора семантических токенов, который способствует уменьшению шума семантических признаков, не относящихся ни к подделке, ни к семантическим понятиям. Далее, используя визуальную реконструкцию, мы предложили модуль обучения дискрепантности понятий, который усиливает взаимодействие между семантическими признаками и признаками подделки, используя семантические понятия в качестве руководства. Наконец, модуль улучшения низкоуровневых признаков подделки интегрирует полученные семантические различия, чтобы сократить ненужный информационный шум.
## Результаты
Нами проведены эксперименты на двух стандартных датасетах для обнаружения подделок в изображениях. Обнаружено, что SDD превосходит существующие модели в точности и общей эффективности. В частности, SDD демонстрирует высокую точность в локализации формализованных признаков подделки и уменьшает шум в семантических признаках. Результаты показывают, что SDD может более точно идентифицировать различные типы подделок, включая пропорциональные и стилистические модификации. Наши результаты доступны в открытом доступе по ссылке: https://github.com/wzy1111111/SSD.
## Значимость
Предложенный подход имеет широкое потенциальное применение в области безопасности цифровых медиа, включая мониторинг содержимого в социальных сетях, проверку документов и видео, а также в области сертификации цифровых медиа. SDD предоставляет значительные преимущества по сравнению с предыдущими моделями, включая улучшенную
Abstract
With the rapid advancement of image generation techniques, robust forgery
detection has become increasingly imperative to ensure the trustworthiness of
digital media. Recent research indicates that the learned semantic concepts of
pre-trained models are critical for identifying fake images. However, the
misalignment between the forgery and semantic concept spaces hinders the
model's forgery detection performance. To address this problem, we propose a
novel Semantic Discrepancy-aware Detector (SDD) that leverages reconstruction
learning to align the two spaces at a fine-grained visual level. By exploiting
the conceptual knowledge embedded in the pre-trained vision language model, we
specifically design a semantic token sampling module to mitigate the space
shifts caused by features irrelevant to both forgery traces and semantic
concepts. A concept-level forgery discrepancy learning module, built upon a
visual reconstruction paradigm, is proposed to strengthen the interaction
between visual semantic concepts and forgery traces, effectively capturing
discrepancies under the concepts' guidance. Finally, the low-level forgery
feature enhancemer integrates the learned concept level forgery discrepancies
to minimize redundant forgery information. Experiments conducted on two
standard image forgery datasets demonstrate the efficacy of the proposed SDD,
which achieves superior results compared to existing methods. The code is
available at https://github.com/wzy1111111/SSD.
Ссылки и действия
Дополнительные ресурсы: