📊 Статистика дайджестов
Всего дайджестов: 34022 Добавлено сегодня: 82
Последнее обновление: сегодня
Авторы:
Zixun Wang, Ben Dai
Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Semantic segmentation labels each pixel in an image with its corresponding
class, and is typically evaluated using the Intersection over Union (IoU) and
Dice metrics to quantify the overlap between predicted and ground-truth
segmentation masks. In the literature, most existing methods estimate
pixel-wise class probabilities, then apply argmax or thresholding to obtain the
final prediction. These methods have been shown to generally lead to
inconsistent or suboptimal results, as they do not direc...
Авторы:
M. Hadi Sepanj, Benyamin Ghojogh, Paul Fieguth
## Контекст
Self-supervised learning (SSL) является важной областью исследований в машинном обучении, которая позволяет извлекать представления без опоры на метки. Основная идея SSL заключается в оптимизации геометрических целей, таких как устойчивость к аугментациям, сохранение дисперсии и корреляционная декорреляция фич. Несмотря на эффективность SSL, большинство методов работают в Евклидовом пространстве, ограничивая их возможность локализовать и логически выразить нелинейные зависимости и геометрические структуры. Эта проблема становится особенно актуальной при работе с данными, характеризующимися сложной геометрической структурой. Целью данного исследования является развитие нового фреймворка SSL, который может эффективно работать в пространстве Репродуктивного Хильбертового Пространства (RKHS), обеспечивая более тонкую обработку нелинейных характеристик.
## Метод
Предлагаемый Kernel VICReg является расширением существующего VICReg-подхода, переводя его в RKHS. Фундаментальная идея состоит в том, что каждый компонент VICReg-функционала (вариация, инвариантность и корреляция) переносится в RKHS с помощью ядерных функций. Это позволяет обобщить VICReg таким образом, что он может обрабатывать нелинейные структуры без непосредственного применения методик матричных преобразований. В Kernel VICReg широко используется двойная центрированная норма Хильберта-Шмидта, которая позволяет управлять геометрическими свойствами представлений. Особенностью нового подхода является его универсальность и гибкость при работе со сложными данными, даже при ограниченном объеме данных.
## Результаты
Проведенные эксперименты посвящены сравнению Kernel VICReg с его евклидовым аналогом на различных датасетах, включая MNIST, CIFAR-10, STL-10, TinyImageNet и ImageNet100. Результаты показали, что Kernel VICReg не только избегает представительного коллапса, но и показывает более высокую точность, особенно на датасетах, где геометрическая сложность высока. Например, на TinyImageNet и ImageNet100, Kernel VICReg показал значительные улучшения в отношении точности и структуры представлений. Кроме того, UMAP-визуализации показали, что представления, полученные с помощью Kernel VICReg, обладают более высоким уровнем изометрии и более четкими классовыми границами, что свидетельствует о более эффективной обработке нелинейных структур.
## Значимость
Kernel VICReg открывает новые горизонты для применения SSL в областях, где данные имеют сложную геометрическую структуру. Его можно применить в таких областях, как глубокое обучение для медицины, геологии или текстовых данных, где нелинейные зависимости яв
Annotation:
Self-supervised learning (SSL) has emerged as a powerful paradigm for
representation learning by optimizing geometric objectives--such as invariance
to augmentations, variance preservation, and feature decorrelation--without
requiring labels. However, most existing methods operate in Euclidean space,
limiting their ability to capture nonlinear dependencies and geometric
structures. In this work, we propose Kernel VICReg, a novel self-supervised
learning framework that lifts the VICReg objective ...
Авторы:
Chenxu Zhao, Wei Qian, Aobo Chen, Mengdi Huai
## Контекст
В последнее время глубокие нейронные сети приобрели широкое применение в различных областях, однако они также остаются уязвимыми к различным атакам, в том числе членству. Членствующие (membership) информационные атаки (Membership Inference Attacks, MIAs) стремятся определить, был ли конкретный объект использован в ходе обучения целевой модели. Эти атаки представляют собой серьезную угрозу для приватности данных и могут привести к использованию персональных данных без согласия.
Несмотря на активность исследователей в области MIAs, существуют ограничения в обеспечении контроля за выводом ложноположительных результатов (false discovery rate, FDR). Это ограничение связано с неизвестностью основных распределений данных и сложностью учета зависимости между нейронными сетями. Мотивируясь этим, данная работа предлагает новую модель MIAs, которая обеспечивает контроль за FDR и повышает надежность результатов.
## Метод
Метод предлагаемой работы основывается на построении модели, которая может не только определять членство, но и контролировать FDR. Метод заключается в том, чтобы учесть зависимости между нейронными сетями, применяя методы статистического анализа для оценки ложноположительных результатов.
Была разработана архитектура, которая включает в себя несколько этапов:
1. Инициализация модели, учитывающая FDR-гарантии.
2. Оптимизация модели для повышения точности в определении членства.
3. Интеграция существующих MIA-методов с помощью пост-хок-модели, которая позволяет управлять FDR в реальном времени.
Таким образом, разработанная модель может быть интегрирована с различными MIA-методами, обеспечивая управление FDR без изменения основной архитектуры.
## Результаты
Работа содержит исследовательские эксперименты, проведенные в различных условиях, включая black-box-и lifelong-настройки. Данные для экспериментов были получены из различных наборов данных, таких как CIFAR-10 и CIFAR-100, чтобы проверить работу модели в различных условиях.
Результаты показали, что модель обеспечивает высокую точность в определении членства, при этом контролируя FDR на уровне, заданном пользователем. На основе этих результатов было показано, что разработанная модель может быть эффективно использована для улучшения надежности MIAs, уменьшения риска ложноположительных результатов и увеличения доверия к результатам.
## Значимость
Предлагаемая модель имеет широкие возможности применения в различных областях, где необходимо обеспечить конфиденциальность данных и контролировать риск ложноположительных результатов. Особенно она может быть полезна для приложений в сфере медицины, финансов и защиты личных данных, где необходимо обеспе
Annotation:
Recent studies have shown that deep learning models are vulnerable to
membership inference attacks (MIAs), which aim to infer whether a data record
was used to train a target model or not. To analyze and study these
vulnerabilities, various MIA methods have been proposed. Despite the
significance and popularity of MIAs, existing works on MIAs are limited in
providing guarantees on the false discovery rate (FDR), which refers to the
expected proportion of false discoveries among the identified po...