📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 RemedyGS: Defend 3D Gaussian Splatting against Computation Cost Attacks

2025-12-02

Авторы:

Yanping Li, Zhening Liu, Zijian Li, Zehong Lin, Jun Zhang

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

As a mainstream technique for 3D reconstruction, 3D Gaussian splatting (3DGS) has been applied in a wide range of applications and services. Recent studies have revealed critical vulnerabilities in this pipeline and introduced computation cost attacks that lead to malicious resource occupancies and even denial-of-service (DoS) conditions, thereby hindering the reliable deployment of 3DGS. In this paper, we propose the first effective and comprehensive black-box defense framework, named RemedyGS,...

ID: 2511.22147v1 cs.CV, cs.AI, cs.CR

arXiv PDF

📄 Are Neuro-Inspired Multi-Modal Vision-Language Models Resilient to Membership Inference Privacy Leakage?

2025-11-27

Авторы:

David Amebley, Sayanton Dibbo

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

In the age of agentic AI, the growing deployment of multi-modal models (MMs) has introduced new attack vectors that can leak sensitive training data in MMs, causing privacy leakage. This paper investigates a black-box privacy attack, i.e., membership inference attack (MIA) on multi-modal vision-language models (VLMs). State-of-the-art research analyzes privacy attacks primarily to unimodal AI-ML systems, while recent studies indicate MMs can also be vulnerable to privacy attacks. While researche...

ID: 2511.20710v1 cs.CV, cs.AI, cs.CR

arXiv PDF

📄 GuardTrace-VL: Detecting Unsafe Multimodel Reasoning via Iterative Safety Supervision

2025-11-27

Авторы:

Yuxiao Xiang, Junchi Chen, Zhenchao Jin, Changtao Miao, Haojie Yuan, Qi Chu, Tao Gong, Nenghai Yu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Multimodal large reasoning models (MLRMs) are increasingly deployed for vision-language tasks that produce explicit intermediate rationales. However, reasoning traces can contain unsafe content even when the final answer is non-harmful, creating deployment risks. Existing multimodal safety guards primarily evaluate only the input question and the final answer, neglecting the intermediate reasoning process. This oversight allows undetected harm, such as biased inferences or policy-violating use o...

ID: 2511.20994v1 cs.CV, cs.AI, cs.CR

arXiv PDF

📄 On the Feasibility of Hijacking MLLMs' Decision Chain via One Perturbation

2025-11-26

Авторы:

Changyue Li, Jiaying Li, Youliang Yuan, Jiaming He, Zhicong Huang, Pinjia He

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Conventional adversarial attacks focus on manipulating a single decision of neural networks. However, real-world models often operate in a sequence of decisions, where an isolated mistake can be easily corrected, but cascading errors can lead to severe risks. This paper reveals a novel threat: a single perturbation can hijack the whole decision chain. We demonstrate the feasibility of manipulating a model's outputs toward multiple, predefined outcomes, such as simultaneously misclassifying "no...

ID: 2511.20002v1 cs.CV, cs.AI, cs.CR

arXiv PDF

📄 Security Risk of Misalignment between Text and Image in Multi-modal Model

2025-11-01

Авторы:

Xiaosen Wang, Zhijin Ge, Shaokang Wang

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Despite the notable advancements and versatility of multi-modal diffusion models, such as text-to-image models, their susceptibility to adversarial inputs remains underexplored. Contrary to expectations, our investigations reveal that the alignment between textual and Image modalities in existing diffusion models is inadequate. This misalignment presents significant risks, especially in the generation of inappropriate or Not-Safe-For-Work (NSFW) content. To this end, we propose a novel attack ca...

ID: 2510.26105v1 cs.CV, cs.AI, cs.CR

arXiv PDF

📄 SafeVision: Efficient Image Guardrail with Robust Policy Adherence and Explainability

2025-10-30

Авторы:

Peiyang Xu, Minzhou Pan, Zhaorun Chen, Shuang Yang, Chaowei Xiao, Bo Li

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

With the rapid proliferation of digital media, the need for efficient and transparent safeguards against unsafe content is more critical than ever. Traditional image guardrail models, constrained by predefined categories, often misclassify content due to their pure feature-based learning without semantic reasoning. Moreover, these models struggle to adapt to emerging threats, requiring costly retraining for new threats. To address these limitations, we introduce SafeVision, a novel image guardra...

ID: 2510.23960v1 cs.CV, cs.AI, cs.CR

arXiv PDF

📄 Beyond Spectral Peaks: Interpreting the Cues Behind Synthetic Image Detection

2025-10-09

Авторы:

Sara Mandelli, Diego Vila-Portela, David Vázquez-Padín, Paolo Bestagini, Fernando Pérez-González

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Over the years, the forensics community has proposed several deep learning-based detectors to mitigate the risks of generative AI. Recently, frequency-domain artifacts (particularly periodic peaks in the magnitude spectrum), have received significant attention, as they have been often considered a strong indicator of synthetic image generation. However, state-of-the-art detectors are typically used as black-boxes, and it still remains unclear whether they truly rely on these peaks. This limits t...

ID: 2510.05633v1 cs.CV, cs.AI, cs.CR

arXiv PDF

📄 The Impact of Scaling Training Data on Adversarial Robustness

2025-10-02

Авторы:

Marco Zimmerli, Andreas Plesner, Till Aczel, Roger Wattenhofer

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Deep neural networks remain vulnerable to adversarial examples despite advances in architectures and training paradigms. We investigate how training data characteristics affect adversarial robustness across 36 state-of-the-art vision models spanning supervised, self-supervised, and contrastive learning approaches, trained on datasets from 1.2M to 22B images. Models were evaluated under six black-box attack categories: random perturbations, two types of geometric masks, COCO object manipulations,...

ID: 2509.25927v1 cs.CV, cs.AI, cs.CR, cs.LG

arXiv PDF

📄 Generative Adversarial Networks Applied for Privacy Preservation in Biometric-Based Authentication and Identification

2025-09-26

Авторы:

Lubos Mjachky, Ivan Homoliak

## Контекст Системы биометрической идентификации и аутентификации находят широкое применение в различных сферах быта и бизнеса, включая банки, мобильные устройства, доступ к системам. Однако эти системы часто сталкиваются с проблемами, связанными с защитой личных данных пользователей. Зачастую, пользователи не могут контролировать использование своих биометрических данных, что приводит к риску утечки информации и её неправомерному использованию. Этот факт определяет необходимость развития методов, обеспечивающих конфиденциальность и безопасность такого рода систем. Наша мотивация заключается в разработке метода, который обеспечивает защиту личных данных без ущерба для их значимости в процессе идентификации и аутентификации. ## Метод Мы предлагаем использовать генерирующую противоположную сеть (GAN) для решения проблемы конфиденциальности в системах биометрической идентификации. Метод предполагает преобразование лиц на изображениях в визуально неузнаваемый вид, такой как фотографии цветов или обуви. Эти изображения становятся входными данными для системы идентификации. Для обеспечения значимости идентификации сеть обучается сохранять важные свойства лица, необходимые для точной идентификации. Это достигается благодаря двум сетям GAN, которые соревнуются друг с другом: одна преобразует изображения в защищенный вид, а другая пытается воспринимать эти изображения как лица. Этот подход обеспечивает компромисс между конфиденциальностью и функциональностью системы. ## Результаты Мы провели эксперименты с использованием разных наборов данных, в том числе лиц, цветами и обувью. Результаты показывают, что метод обеспечивает высокую точность идентификации, даже когда лица представлены в виде неузнаваемых изображений. Кроме того, мы проверили устойчивость системы к атакам, таким как маскирование и подделка. Метод проявил высокую устойчивость, что демонстрирует его эффективность в защите пользовательских данных. ## Значимость Наш метод может использоваться в различных сферах, где необходима защита личных данных, включая банковские системы, мобильные приложения и системы управления доступом. Он обеспечивает конфиденциальность без потери функциональности, что делает его привлекательным для многих приложений. Благодаря своей гибкости и устойчивости к атакам, данный подход может стать ключевым моментом в развитии безопасных и конфиденциальных систем идентификации. ## Выводы Мы разработали метод биометрической идентификации, основанный на генерирующих противопо

Annotation:

Biometric-based authentication systems are getting broadly adopted in many areas. However, these systems do not allow participating users to influence the way their data is used. Furthermore, the data may leak and can be misused without the users' knowledge. In this paper, we propose a new authentication method that preserves the privacy of individuals and is based on a generative adversarial network (GAN). Concretely, we suggest using the GAN for translating images of faces to a visually privat...

ID: 2509.20024v1 cs.CV, cs.AI, cs.CR

arXiv PDF

📄 Multi View Slot Attention Using Paraphrased Texts For Face Anti-Spoofing

2025-09-10

Авторы:

Jeongmin Yu, Susang Kim, Kisu Lee, Taekyoung Kwon, Won-Yong Shin, Ha Young Kim

## Контекст Face anti-spoofing (FAS) — критическая задача в области безопасности и аутентификации, которая стремится отличить настоящие лица от имитаций. Несмотря на развитие методов FAS, остаются существенные проблемы, такие как недостаток общедоступных данных, ограниченная универсальность и трудность обнаружения сложных механизмов спуфинга. Недавние работы используют языковые модели, такие как CLIP, для улучшения generalization и обнаружения кросс-доменных задач. Однако, существующие решения не полностью используют возможности CLIP, особенно в выделении ключевых признаков спуфинга. Поэтому, необходимо развитие методов, которые бы улучшили качество обнаружения спуфинга, обеспечили кросс-доменную универсальность и повысили обобщаемость. ## Метод Мы предлагаем MVP-FAS — новую архитектуру, включающую два модуля: Multi-View Slot Attention (MVS) и Multi-Text Patch Alignment (MTPA). **MVS** применяет клоны CLIP для выделения локальных детальных признаков и глобального контекста. Он использует несколько парафразированных текстов, таких как "live" и "fake", для улучшения обнаружения ключевых признаков. **MTPA** выравнивает патчи с разными представлениями текста, что позволяет повысить устойчивость и общий контекст. Эти модули работают вместе для оптимального представления и обнаружения. Мы также используем трансформерские модели для объединения этих представлений. ## Результаты Мы проводили эксперименты на нескольких кросс-доменных датасетах, таких как OULU-NPU и SiW. Модель MVP-FAS показала высокую точность и общую универсальность в сравнении с предыдущими стандартными подходами. Мы также проверяли ее на разных типах спуфинга, и она показала значительное улучшение в обнаружении трудных спуфингов. Модель также показала модульность и устойчивость к ошибкам. ## Значимость Модель MVP-FAS может быть применена в различных областях безопасности, таких как банковские системы, доступ к устройствам и системы аутентификации. Это решение превосходит предыдущие подходы в обнаружении кросс-доменных задач, обеспечивая более точное и устойчивое обнаружение. Улучшение в кросс-доменной обобщаемости делает MVP-FAS более полезной для реализации в реальных условиях. ## Выводы Мы представили MVP-FAS, модель, которая улучшила обнаружение спуфинга с помощью новых модулей MVS и MTPA. Мы демонстрируем ее высокую точность и общую обобщаемость в кросс-доменных сценариях. В дальнейшем, мы планируем расширить модель для работы с более сложными видами спуфинга и исследовать ее возможности в других задачах, таких как текстово-визуальные модели.

Annotation:

Recent face anti-spoofing (FAS) methods have shown remarkable cross-domain performance by employing vision-language models like CLIP. However, existing CLIP-based FAS models do not fully exploit CLIP's patch embedding tokens, failing to detect critical spoofing clues. Moreover, these models rely on a single text prompt per class (e.g., 'live' or 'fake'), which limits generalization. To address these issues, we propose MVP-FAS, a novel framework incorporating two key modules: Multi-View Slot atte...

ID: 2509.06336v1 cs.CV, cs.AI, cs.CR

arXiv PDF

Показано 1 - 10 из 14 записей