📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 0

Последнее обновление: сегодня

📄 Nearest Neighbor Projection Removal Adversarial Training

2025-09-11

Авторы:

Himanshu Singh, A. V. Subramanyam, Shivank Rajput, Mohan Kankanhalli

#### Контекст Deep neural networks (DNNs) показали выдающуюся производительность в задачах классификации изображений, однако остаются уязвимы к адверсарному машинному обучению. Традиционные методы укрепления обучения, такие как standard adversarial training, увеличивают общую устойчивость сетей к атакам, но часто игнорируют важный фактор — интер-классовые зависимости в пространстве признаков. Эти зависимости значительно снижают устойчивость сетей к адверсарным примерам. Наша работа посвящена исследованию этих зависимостей и использованию эффективных методов для их устранения в процессе обучения. Мы предлагаем новую архитектуру, которая активно решает проблему интер-классовой приближенности в многоклассовых классификационных задачах. #### Метод В нашей работе мы предлагаем процедуру, которая сначала определяет ближайших интер-классовых соседей для каждого примера в адверсарном и чистном пространстве признаков. Затем мы исключаем проекции примеров на эти соседние признаки, чтобы улучшить разделение классов. Для того чтобы уменьшить влияние интер-классовой приближенности, мы применяем логитс-коррекцию. Это позволяет уменьшить липшицев константу нейронных сетей и, как следствие, снизить Rademacher-сложность, что улучшает общее качество и устойчивость модели. Мы используем алгоритмы, которые могут быть интегрированы в существующие архитектуры DNN без существенных изменений. #### Результаты Мы провели эксперименты на стандартных датасетах CIFAR-10, CIFAR-100 и SVHN. Наши результаты показали, что предложенная модель демонстрирует высокую точность как в Attack-проверочных, так и в чистых условиях. Мы сравнили нашу модель с другими методами укрепления обучения, такими как TRADES и FreeAdversarialTraining. Наше решение показало себя сильно, стабильно превосходя многие конкурирующие элементы. Мы также проанализировали свойства обученных моделей, такие как Rademacher и Lipschitz-сложность, и показали, что наше решение выгодно влияет на небольшой Rademacher-сложность, что повышает устойчивость к адверсарным примерам. #### Значимость Предлагаемый подход может быть применен во многих областях, где необходима высокая устойчивость к адверсарным примерам, таких как безопасность в системах по отделению изображений в полевых условиях, системы распознавания образов в медицине, а также в системах автоматической диагностики. Наш подход имеет несколько преимуществ перед существующими методами: он не только повышает устойчивость к адверсарным примерам, но и сохраняет высокую точность в чистых условиях. Это может существенно влиять на будущие развития в области машинного обучения, по

Annotation:

Deep neural networks have exhibited impressive performance in image classification tasks but remain vulnerable to adversarial examples. Standard adversarial training enhances robustness but typically fails to explicitly address inter-class feature overlap, a significant contributor to adversarial susceptibility. In this work, we introduce a novel adversarial training framework that actively mitigates inter-class proximity by projecting out inter-class dependencies from adversarial and clean samp...

ID: 2509.07673v2 cs.CV, cs.LG, 68T45 (Primary), 68T10 (Secondary), I.5.4

arXiv PDF

📄 Towards Optimal Convolutional Transfer Learning Architectures for Breast Lesion Classification and ACL Tear Detection

2025-08-27

Авторы:

Daniel Frees, Moritz Bolling, Aditri Bhagirath

#### Контекст Модерная компьютерная визуализация нашла широкое применение в медицинских иммуниграциях, включая классификацию и сегментацию изображений. Однако, существующие модели часто сталкиваются с ограниченным размером медицинских данных, что снижает их эффективность. Трансферное обучение (transfer learning) стало ключевым решением этой проблемы, позволяя использовать предобученные модели на больших объемах данных для улучшения классификации на малых датасетах. Ранее, Mei et al. (2022) обнаружили, что предобучение CNN-моделей на большой выборке изображений, отмеченных радиологами (RadImageNet), повысило качество решения задач классификации по сравнению с предобучениями на ImageNet. В данной работе мы проводим подробное исследование для определения оптимальных архитектур конволюционных нейронных сетей для диагностики злокачественных подвздошных зубков и разрывов связок анатрофий (ACL), а также проводим статистический анализ влияния RadImageNet и ImageNet на последующие результаты модели. #### Метод Мы исследуем различные архитектуры конволюционных нейронных сетей с различными типами слоев, включая 1D-конволюции, полносвязные слои и skip-соединения. Модели предобучены на большом датасете RadImageNet или ImageNet, затем принимают участие в трейнинге на малых датасетах для классификации злокачественных подвздошных зубков и разрывов ACL. Мы рассматриваем стратегии, такие как полное и частичное размотывание бэкбоны, чтобы оптимизировать последующие результаты. Для сравнения, мы используем метрики AUC (Area Under Curve) для оценки качества классификации. #### Результаты Наши эксперименты показали, что 1D-конволюционные классификаторы с skip-соединениями, бэкбонами ResNet50 и частичным размотом бэкбона демонстрируют оптимальные результаты. Мы получили AUC 0.9969 для диагностики разрывов ACL и 0.9641 для классификации злокачественных подвздошных зубков. Эти результаты сравнимы с теми, полученными Mei et al. (2022), и превосходят другие работы в этой области. Наши исследования не подтвердили, что RadImageNet предобучение обеспечивает лучшую последующую производительность для задач классификации подвздошных зубков и разрывов ACL. #### Значимость Наша работа имеет большое значение для развития медицинских искусственных нейронных сетей. Оптимальные архитектуры, разработанные в этом исследовании, могут использоваться для других задач классификации медицинских изображений, включая диагностику раковых опухолей и инфекций. Мы также подтвердили, что предобучение на больших датасетах не всегда является существенным фактором для повышения модели, что мож

Annotation:

Modern computer vision models have proven to be highly useful for medical imaging classification and segmentation tasks, but the scarcity of medical imaging data often limits the efficacy of models trained from scratch. Transfer learning has emerged as a pivotal solution to this, enabling the fine-tuning of high-performance models on small data. Mei et al. (2022) found that pre-training CNNs on a large dataset of radiologist-labeled images (RadImageNet) enhanced model performance on downstream t...

ID: 2508.17567v2 cs.CV, cs.LG, 68T45

arXiv PDF