Semantic Discrepancy-aware Detector for Image Forgery Identification

2508.12341v1 cs.CV, cs.AI 2025-08-19

Авторы:

Ziye Wang, Minghang Yu, Chunyan Xu, Zhen Cui

Резюме на русском

## Контекст Современные технологии генерации изображений позволяют создавать реалистичные снимки, что становится вопросом для обеспечения доверия к цифровым медиа. Несанкционированное изменение изображений может привести к серьезным последствиям, включая повреждение репутации индивида или организации. Обнаружение подделок в изображениях является ключевым заданием, требующим внимательного подхода. Несмотря на прогрессы в искусственном интеллекте, существуют проблемы, связанные с несоответствием между пространствами подделок и семантических понятий, что снижает эффективность существующих моделей. Этот факт требует разработки новых подходов, способных лучше интерпретировать формальные и семантические признаки подделок в изображениях. ## Метод Мы предлагаем метод Semantic Discrepancy-aware Detector (SDD), который оперирует семантическими признаками изображений. Метод основывается на реконструкционном обучении для выравнивания пространств семантических понятий и подделок. В качестве основы используется предварительно обученная модель визионного языкового моделирования. Мы разработали модуль выбора семантических токенов, который способствует уменьшению шума семантических признаков, не относящихся ни к подделке, ни к семантическим понятиям. Далее, используя визуальную реконструкцию, мы предложили модуль обучения дискрепантности понятий, который усиливает взаимодействие между семантическими признаками и признаками подделки, используя семантические понятия в качестве руководства. Наконец, модуль улучшения низкоуровневых признаков подделки интегрирует полученные семантические различия, чтобы сократить ненужный информационный шум. ## Результаты Нами проведены эксперименты на двух стандартных датасетах для обнаружения подделок в изображениях. Обнаружено, что SDD превосходит существующие модели в точности и общей эффективности. В частности, SDD демонстрирует высокую точность в локализации формализованных признаков подделки и уменьшает шум в семантических признаках. Результаты показывают, что SDD может более точно идентифицировать различные типы подделок, включая пропорциональные и стилистические модификации. Наши результаты доступны в открытом доступе по ссылке: https://github.com/wzy1111111/SSD. ## Значимость Предложенный подход имеет широкое потенциальное применение в области безопасности цифровых медиа, включая мониторинг содержимого в социальных сетях, проверку документов и видео, а также в области сертификации цифровых медиа. SDD предоставляет значительные преимущества по сравнению с предыдущими моделями, включая улучшенную

Abstract

With the rapid advancement of image generation techniques, robust forgery detection has become increasingly imperative to ensure the trustworthiness of digital media. Recent research indicates that the learned semantic concepts of pre-trained models are critical for identifying fake images. However, the misalignment between the forgery and semantic concept spaces hinders the model's forgery detection performance. To address this problem, we propose a novel Semantic Discrepancy-aware Detector (SDD) that leverages reconstruction learning to align the two spaces at a fine-grained visual level. By exploiting the conceptual knowledge embedded in the pre-trained vision language model, we specifically design a semantic token sampling module to mitigate the space shifts caused by features irrelevant to both forgery traces and semantic concepts. A concept-level forgery discrepancy learning module, built upon a visual reconstruction paradigm, is proposed to strengthen the interaction between visual semantic concepts and forgery traces, effectively capturing discrepancies under the concepts' guidance. Finally, the low-level forgery feature enhancemer integrates the learned concept level forgery discrepancies to minimize redundant forgery information. Experiments conducted on two standard image forgery datasets demonstrate the efficacy of the proposed SDD, which achieves superior results compared to existing methods. The code is available at https://github.com/wzy1111111/SSD.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Semantic Discrepancy-aware Detector for Image Forgery Identification

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Dual-Stream Spectral Decoupling Distillation for Remote Sensing Object Detection

Explainable Parkinsons Disease Gait Recognition Using Multimodal RGB-D Fusion an...

GuidNoise: Single-Pair Guided Diffusion for Generalized Noise Synthesis

PhyVLLM: Physics-Guided Video Language Model with Motion-Appearance Disentanglem...

Detection of Intoxicated Individuals from Facial Video Sequences via a Recurrent...

Навигация