CoUn: Empowering Machine Unlearning via Contrastive Learning
2509.16391v1
cs.LG, cs.AI, cs.CV
2025-09-24
Авторы:
Yasser H. Khalil, Mehdi Setayesh, Hongliang Li
Резюме на русском
#### Контекст
Современные методы машинного обучения часто основываются на больших объемах данных, которые могут включать конфиденциальные или нежелательные данные. В ситуациях, когда пользователи или организации хотят удалить эти данные из модели без влияния на остальные данные, возникает потребность в методах машинного "учения" (machine unlearning, MU). Несмотря на то что существуют существующие подходы, такие как манипуляции с метками или изменения весов модели, они часто инэффективны или слишком затратны. Наша мотивация заключается в разработке более эффективного и универсального подхода к MU, который мог бы надежно удалять данные без ущерба для остальных.
#### Метод
Мы предлагаем CoUn, новый подход к MU, который основывается на идее, что модель, обученная с нуля на основе только "сохраняемых" данных, может точно классифицировать "удаляемые" данные. Это достигается благодаря использованию контрастного обучения (contrastive learning, CL) и супервизированного обучения. Метод CoUn (1) использует контрастное обучение, чтобы приближать семантическое подклассификацию объектов "данных для удаления" к тем, которые остаются в модели, и (2) применяет супервизированное обучение, чтобы сохранить структуру данных, которые остаются в модели. Это позволяет CoUn надежно удалять данные без искажения остальных данных.
#### Результаты
Мы проверили CoUn на нескольких датасетах, включая CIFAR-10 и CIFAR-100, используя модели, такие как ResNet и DenseNet. Наши эксперименты показали, что CoUn превосходит существующие подходы в силу его эффективности в MU. Например, CoUn позволил достичь до 30% улучшения в сравнении с базовым подходом, при этом сохраняя качество классификации для оставшихся данных. Мы также проверили, насколько эффективно можно интегрировать наш CL-модуль в существующие MU-методы, показав, что это может повысить их производительность.
#### Значимость
Помимо того, что CoUn эффективен, он также обладает широкими потенциальными применениями в областях, где важно соблюдать конфиденциальность данных, таких как здравоохранение, финансы и безопасность. Наш подход обеспечивает более надежный и менее затратный способ удаления данных, чем существующие решения. Кроме того, повышенная эффективность CoUn в MU может повлиять на развитие новых методов шифрования и безопасности в машинном обучении.
#### Выводы
Мы представили CoUn, новый подход к MU, который основывается на контрастном обучении и супервизированном обучении. Мы показали, что наш подход превосходит существующие методы, при этом сохраняя качество классификации для "удерживаемых" данных. Будущие исследования будут сфокусированы на расширении этого подхода
Abstract
Machine unlearning (MU) aims to remove the influence of specific "forget"
data from a trained model while preserving its knowledge of the remaining
"retain" data. Existing MU methods based on label manipulation or model weight
perturbations often achieve limited unlearning effectiveness. To address this,
we introduce CoUn, a novel MU framework inspired by the observation that a
model retrained from scratch using only retain data classifies forget data
based on their semantic similarity to the retain data. CoUn emulates this
behavior by adjusting learned data representations through contrastive learning
(CL) and supervised learning, applied exclusively to retain data. Specifically,
CoUn (1) leverages semantic similarity between data samples to indirectly
adjust forget representations using CL, and (2) maintains retain
representations within their respective clusters through supervised learning.
Extensive experiments across various datasets and model architectures show that
CoUn consistently outperforms state-of-the-art MU baselines in unlearning
effectiveness. Additionally, integrating our CL module into existing baselines
empowers their unlearning effectiveness.
Ссылки и действия
Дополнительные ресурсы: