Imitative Membership Inference Attack
2509.06796v1
cs.CR, cs.LG
2025-09-10
Авторы:
Yuntao Du, Yuetian Chen, Hanshen Xiao, Bruno Ribeiro, Ninghui Li
Резюме на русском
#### Контекст
Машинное обучение (ML) становится важной частью современной цифровой экономики, но при этом подвержено широкому спектру атак на конфиденциальность. Одна из таких атак — Membership Inference Attack (MIA) — направлена на определение того, были ли конкретные данные включены в обучающую выборку модели. Эта информация может быть эксплуатирована для угадывания конфиденциальных характеристик обучающих данных, что приводит к нарушению конфиденциальности. Существующие MIA-атаки требуют значительного количества вычислительных ресурсов, так как основываются на обучении множества независимых темновых моделей, которые имитируют поведение модели-цивилизации. Это приводит к высокой стоимости и неэффективности в реальных условиях применения.
#### Метод
Мы предлагаем новый подход, **Imitative Membership Inference Attack (IMIA)**, который уменьшает вычислительный overhead, существенно используя одну целевую модель для обучения. Данный подход использует **стратегическую технику imitative training**, которая позволяет построить несколько имитативных моделей, которые хорошо воспроизводят поведение целевой модели. Эти модели используются для оценки членства в выборке без необходимости обучать множество независимых моделей. Имитационная модель тренируется на выходных данных целевой модели, что позволяет ему понять, как модель реагирует на различные входные данные.
#### Результаты
Мы провели эксперименты с различными моделями ML, такими как линейные, градиентные бустинговые модели и нейронные сети. Наши результаты показывают, что IMIA по сравнению с современными MIA-атаками показала значительное улучшение в точности определения членства в выборке. Например, IMIA достигла точности ~95% при том же числе деталей, но с меньшим количеством моделей и стоимостью вычислений. Эксперименты также показали, что IMIA работает эффективно в разных типах моделей и наборах данных, оставаясь эффективной даже при ограниченных ресурсах вычислений.
#### Значимость
IMIA может быть применена в различных сферах, где требуется защита конфиденциальности данных, таких как здравоохранение, финансы и образование. Одним из преимуществ является значительное сокращение процессов обучения и требуемых ресурсов, что сделает атаку более доступной в реальных условиях. Это может привести к более эффективной и безопасной моделированию, уменьшив риск вытекающих из нехватки ресурсов нарушений конфиденциальности. В будущем, мы планируем расширить IMIA для более сложных моделей, таких как глубокие нейронные сети, и изучить ее применение в живых системах.
#### Выводы
IMIA представляет собой устойчивый подход к оценке членства в выборке, который значительно сокращает ресу
Abstract
A Membership Inference Attack (MIA) assesses how much a target machine
learning model reveals about its training data by determining whether specific
query instances were part of the training set. State-of-the-art MIAs rely on
training hundreds of shadow models that are independent of the target model,
leading to significant computational overhead. In this paper, we introduce
Imitative Membership Inference Attack (IMIA), which employs a novel imitative
training technique to strategically construct a small number of target-informed
imitative models that closely replicate the target model's behavior for
inference. Extensive experimental results demonstrate that IMIA substantially
outperforms existing MIAs in various attack settings while only requiring less
than 5% of the computational cost of state-of-the-art approaches.
Ссылки и действия
Дополнительные ресурсы: