Analise de Desaprendizado de Maquina em Modelos de Classificacao de Imagens Medicas
2508.18509v1
eess.IV, cs.AI, cs.CV
2025-08-28
Авторы:
Andreza M. C. Falcao, Filipe R. Cordeiro
Резюме на русском
## Контекст
В современной медицине играют ключевую роль автоматизированные системы, которые помогают в диагностике различных заболеваний. Одной из самых распространенных задач в этой области является классификация медицинских изображений. Однако появление новых законодательных требований, таких как GDPR, поднимает вопросы о защите персональных данных, в том числе в медицинской сфере. Если пациент запрашивает удаление своих медицинских данных, модели, использованные для их обработки, должны быть адаптированы к этому решению. Технология **machine unlearning** предлагает решение этой проблемы, удаляя конкретные данные из модели без полной переучетов. Однако до сих пор не удалось изучить эффективность этой технологии в контексте медицинской классификации изображений. **Analise de Desaprendizado de Maquina em Modelos de Classificacao de Imagens Medicas** (Исследование удаления изучения в моделях классификации медицинских изображений) — это попытка заполнить эту гапы.
## Метод
В работе были использованы следующие данные: PathMNIST, OrganAMNIST, и BloodMNIST. Они представляют собой наборы данных медицинских изображений, используемых для обучения моделей классификации. Методология основывается на алгоритме **SalUn**, который предлагает эффективно удалять данные из модели без значительного потери качества. Авторы также проводили эксперименты для оценки воздействия данных аugmentation (увеличения разнообразия изображений) на качество удаления. Эта методика позволяет изучить, насколько SalUn эффективен в сравнении с полным переучетом модели.
## Результаты
На базе вышеупомянутых датасетов проведены эксперименты сравнивались качество моделей, полученных после удаления данных, с моделями, полученными через полную переучутовку. Результаты показали, что удаление данных с помощью SalUn приводит к качеству, близкому к качеству моделей, полученных через полное переучение. Таким образом, SalUn демонстрирует свою эффективность в удалении частичных данных. Было также установлено, что **data augmentation** может положительно повлиять на качество удаления, улучшая модель.
## Значимость
Результаты этого исследования имеют важное значение для области медицинской классификации изображений. Данный подход может быть применен для соблюдения законов о защите данных, таких как GDPR или CCPA. Эта технология также может улучшить безопасность и конфиденциальность в медицинских системах. Кроме того, SalUn может сделать модели более экономичными, поскольку удаление данных эффективнее, чем полная переучутовка.
## Выводы
Результаты экспериментов показали, что **SalUn** может быть эффективным во время удаления частичных данных из моделей классификации медицинских изображений. Он демонст
Abstract
Machine unlearning aims to remove private or sensitive data from a
pre-trained model while preserving the model's robustness. Despite recent
advances, this technique has not been explored in medical image classification.
This work evaluates the SalUn unlearning model by conducting experiments on the
PathMNIST, OrganAMNIST, and BloodMNIST datasets. We also analyse the impact of
data augmentation on the quality of unlearning. Results show that SalUn
achieves performance close to full retraining, indicating an efficient solution
for use in medical applications.
Ссылки и действия
Дополнительные ресурсы: