Imitative Membership Inference Attack

2509.06796v1 cs.CR, cs.LG 2025-09-10

Авторы:

Yuntao Du, Yuetian Chen, Hanshen Xiao, Bruno Ribeiro, Ninghui Li

Резюме на русском

#### Контекст Машинное обучение (ML) становится важной частью современной цифровой экономики, но при этом подвержено широкому спектру атак на конфиденциальность. Одна из таких атак — Membership Inference Attack (MIA) — направлена на определение того, были ли конкретные данные включены в обучающую выборку модели. Эта информация может быть эксплуатирована для угадывания конфиденциальных характеристик обучающих данных, что приводит к нарушению конфиденциальности. Существующие MIA-атаки требуют значительного количества вычислительных ресурсов, так как основываются на обучении множества независимых темновых моделей, которые имитируют поведение модели-цивилизации. Это приводит к высокой стоимости и неэффективности в реальных условиях применения. #### Метод Мы предлагаем новый подход, **Imitative Membership Inference Attack (IMIA)**, который уменьшает вычислительный overhead, существенно используя одну целевую модель для обучения. Данный подход использует **стратегическую технику imitative training**, которая позволяет построить несколько имитативных моделей, которые хорошо воспроизводят поведение целевой модели. Эти модели используются для оценки членства в выборке без необходимости обучать множество независимых моделей. Имитационная модель тренируется на выходных данных целевой модели, что позволяет ему понять, как модель реагирует на различные входные данные. #### Результаты Мы провели эксперименты с различными моделями ML, такими как линейные, градиентные бустинговые модели и нейронные сети. Наши результаты показывают, что IMIA по сравнению с современными MIA-атаками показала значительное улучшение в точности определения членства в выборке. Например, IMIA достигла точности ~95% при том же числе деталей, но с меньшим количеством моделей и стоимостью вычислений. Эксперименты также показали, что IMIA работает эффективно в разных типах моделей и наборах данных, оставаясь эффективной даже при ограниченных ресурсах вычислений. #### Значимость IMIA может быть применена в различных сферах, где требуется защита конфиденциальности данных, таких как здравоохранение, финансы и образование. Одним из преимуществ является значительное сокращение процессов обучения и требуемых ресурсов, что сделает атаку более доступной в реальных условиях. Это может привести к более эффективной и безопасной моделированию, уменьшив риск вытекающих из нехватки ресурсов нарушений конфиденциальности. В будущем, мы планируем расширить IMIA для более сложных моделей, таких как глубокие нейронные сети, и изучить ее применение в живых системах. #### Выводы IMIA представляет собой устойчивый подход к оценке членства в выборке, который значительно сокращает ресу

Abstract

A Membership Inference Attack (MIA) assesses how much a target machine learning model reveals about its training data by determining whether specific query instances were part of the training set. State-of-the-art MIAs rely on training hundreds of shadow models that are independent of the target model, leading to significant computational overhead. In this paper, we introduce Imitative Membership Inference Attack (IMIA), which employs a novel imitative training technique to strategically construct a small number of target-informed imitative models that closely replicate the target model's behavior for inference. Extensive experimental results demonstrate that IMIA substantially outperforms existing MIAs in various attack settings while only requiring less than 5% of the computational cost of state-of-the-art approaches.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Imitative Membership Inference Attack

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

One Detector Fits All: Robust and Adaptive Detection of Malicious Packages from ...

Mitigating Indirect Prompt Injection via Instruction-Following Intent Analysis

A Hybrid Deep Learning and Anomaly Detection Framework for Real-Time Malicious U...

Leveraging Large Language Models to Bridge On-chain and Off-chain Transparency i...

Real-PGDN: A Two-level Classification Method for Full-Process Recognition of New...

Навигация