CoUn: Empowering Machine Unlearning via Contrastive Learning

2509.16391v1 cs.LG, cs.AI, cs.CV 2025-09-24

Авторы:

Yasser H. Khalil, Mehdi Setayesh, Hongliang Li

Резюме на русском

#### Контекст Современные методы машинного обучения часто основываются на больших объемах данных, которые могут включать конфиденциальные или нежелательные данные. В ситуациях, когда пользователи или организации хотят удалить эти данные из модели без влияния на остальные данные, возникает потребность в методах машинного "учения" (machine unlearning, MU). Несмотря на то что существуют существующие подходы, такие как манипуляции с метками или изменения весов модели, они часто инэффективны или слишком затратны. Наша мотивация заключается в разработке более эффективного и универсального подхода к MU, который мог бы надежно удалять данные без ущерба для остальных. #### Метод Мы предлагаем CoUn, новый подход к MU, который основывается на идее, что модель, обученная с нуля на основе только "сохраняемых" данных, может точно классифицировать "удаляемые" данные. Это достигается благодаря использованию контрастного обучения (contrastive learning, CL) и супервизированного обучения. Метод CoUn (1) использует контрастное обучение, чтобы приближать семантическое подклассификацию объектов "данных для удаления" к тем, которые остаются в модели, и (2) применяет супервизированное обучение, чтобы сохранить структуру данных, которые остаются в модели. Это позволяет CoUn надежно удалять данные без искажения остальных данных. #### Результаты Мы проверили CoUn на нескольких датасетах, включая CIFAR-10 и CIFAR-100, используя модели, такие как ResNet и DenseNet. Наши эксперименты показали, что CoUn превосходит существующие подходы в силу его эффективности в MU. Например, CoUn позволил достичь до 30% улучшения в сравнении с базовым подходом, при этом сохраняя качество классификации для оставшихся данных. Мы также проверили, насколько эффективно можно интегрировать наш CL-модуль в существующие MU-методы, показав, что это может повысить их производительность. #### Значимость Помимо того, что CoUn эффективен, он также обладает широкими потенциальными применениями в областях, где важно соблюдать конфиденциальность данных, таких как здравоохранение, финансы и безопасность. Наш подход обеспечивает более надежный и менее затратный способ удаления данных, чем существующие решения. Кроме того, повышенная эффективность CoUn в MU может повлиять на развитие новых методов шифрования и безопасности в машинном обучении. #### Выводы Мы представили CoUn, новый подход к MU, который основывается на контрастном обучении и супервизированном обучении. Мы показали, что наш подход превосходит существующие методы, при этом сохраняя качество классификации для "удерживаемых" данных. Будущие исследования будут сфокусированы на расширении этого подхода

Abstract

Machine unlearning (MU) aims to remove the influence of specific "forget" data from a trained model while preserving its knowledge of the remaining "retain" data. Existing MU methods based on label manipulation or model weight perturbations often achieve limited unlearning effectiveness. To address this, we introduce CoUn, a novel MU framework inspired by the observation that a model retrained from scratch using only retain data classifies forget data based on their semantic similarity to the retain data. CoUn emulates this behavior by adjusting learned data representations through contrastive learning (CL) and supervised learning, applied exclusively to retain data. Specifically, CoUn (1) leverages semantic similarity between data samples to indirectly adjust forget representations using CL, and (2) maintains retain representations within their respective clusters through supervised learning. Extensive experiments across various datasets and model architectures show that CoUn consistently outperforms state-of-the-art MU baselines in unlearning effectiveness. Additionally, integrating our CL module into existing baselines empowers their unlearning effectiveness.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

CoUn: Empowering Machine Unlearning via Contrastive Learning

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

TV2TV: A Unified Framework for Interleaved Language and Video Generation

The Universal Weight Subspace Hypothesis

STeP-Diff: Spatio-Temporal Physics-Informed Diffusion Models for Mobile Fine-Gra...

Open-Set Domain Adaptation Under Background Distribution Shift: Challenges and A...

First On-Orbit Demonstration of a Geospatial Foundation Model

Навигация