📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня
Авторы:

Benjamin D. Ballyk, Ankit Gupta, Sujay Konda, Kavitha Subramanian, Chris Landon, Ahmed Ammar Naseer, Georg Maierhofer, Sumanth Swaminathan, Vasudevan Venkateshwaran

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Data privacy is a critical challenge in modern medical workflows as the adoption of electronic patient records has grown rapidly. Stringent data protection regulations limit access to clinical records for training and integrating machine learning models that have shown promise in improving diagnostic accuracy and personalized care outcomes. Synthetic data offers a promising alternative; however, current generative models either struggle with time-series data or lack formal privacy guaranties. In...
ID: 2512.00434v1 cs.LG, cs.CR, stat.ML
Авторы:

Hrad Ghoukasian, Shahab Asoodeh

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
We investigate how to optimally design local differential privacy (LDP) mechanisms that reduce data unfairness and thereby improve fairness in downstream classification. We first derive a closed-form optimal mechanism for binary sensitive attributes and then develop a tractable optimization framework that yields the corresponding optimal mechanism for multi-valued attributes. As a theoretical contribution, we establish that for discrimination-accuracy optimal classifiers, reducing data unfairnes...
ID: 2511.16377v1 cs.LG, cs.CR, stat.ML
Авторы:

Hao Liang, Haifeng Wen, Kaishun Wu, Hong Xing

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Federated Learning (FL) is a distributed learning paradigm that preserves privacy by eliminating the need to exchange raw data during training. In its prototypical edge instantiation with underlying wireless transmissions enabled by analog over-the-air computing (AirComp), referred to as \emph{over-the-air FL (AirFL)}, the inherent channel noise plays a unique role of \emph{frenemy} in the sense that it degrades training due to noisy global aggregation while providing a natural source of randomn...
ID: 2510.23463v2 cs.LG, cs.CR, stat.ML
Авторы:

Hao Liang, Haifeng Wen, Kaishun Wu, Hong Xing

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Federated Learning (FL) is a distributed learning paradigm that preserves privacy by eliminating the need to exchange raw data during training. In its prototypical edge instantiation with underlying wireless transmissions enabled by analog over-the-air computing (AirComp), referred to as \emph{over-the-air FL (AirFL)}, the inherent channel noise plays a unique role of \emph{frenemy} in the sense that it degrades training due to noisy global aggregation while providing a natural source of randomn...
ID: 2510.23463v1 cs.LG, cs.CR, stat.ML
Авторы:

Yue Deng, Francisco Santos, Pang-Ning Tan, Lifeng Luo

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']
Annotation:
Deep learning based weather forecasting (DLWF) models leverage past weather observations to generate future forecasts, supporting a wide range of downstream tasks, including tropical cyclone (TC) trajectory prediction. In this paper, we investigate their vulnerability to adversarial attacks, where subtle perturbations to the upstream weather forecasts can alter the downstream TC trajectory predictions. Although research on adversarial attacks in DLWF models has grown recently, generating perturb...
ID: 2510.10140v1 cs.LG, cs.CR, stat.ML
Авторы:

Mahdi Haghifam, Adam Smith, Jonathan Ullman

#### Контекст В последние годы становится все более очевидным, что машинное обучение (ML) может становиться источником угроз для частных данных своих пользователей. Одним из ключевых аспектов этой угрозы является **атака методом включения в выборку (membership inference attack)**, при которой злоумышленник пытается определить, входит ли конкретный объект в обучающую выборку использованной модели. Несмотря на то, что эти атаки были во многом исследованы, остается открытым вопрос о том, насколько много больше данных нужно атакующему, чем используется тренировочной модели. В настоящей работе мы рассматриваем вопрос с точки зрения **сложности выборки (sample complexity)**, то есть минимального числа дополнительных примеров (ссылочных выборок), необходимых для успешного выполнения attack. Область исследования — **оценка среднего значения гауссовского распределения**, где целью является оценка среднего $\mu$ с ограниченной ошибкой. Этот вопрос имеет решающее значение для понимания уязвимости ML-систем и разработки эффективных мер защиты. #### Метод Мы применяем **теоретический подход** для анализа сложности выборки в контексте атак на членство. Наша модель предполагает, что злоумышленнику доступны **ссылочные выборки** из одного и того же распределения, но без предварительного знания о деталях обучающей выборки. Мы формализуем сложность выборки как **минимальное число ссылочных примеров**, необходимое для того, чтобы атакующий мог существенно превосходить случайного атакующего, который не имеет доступа к дополнительным данным. Основной фокус — вопрос того, насколько большой объем дополнительных данных нужен для того, чтобы злоумышленник мог успешно определить включение конкретного объекта в тренировочную выборку. Мы показываем, что для этой задачи **хотя бы $\Omega(n + n^2 \rho^2)$ ссылочных примеров** могут быть необходимы, где $n$ — число примеров в обучающей выборке, а $\rho$ — ограничение на ошибку оценки среднего. Это значит, что необходимо **больше данных**, чем используется в самой модели. #### Результаты Мы проводим эксперименты на гипотетических данных, подтверждая что **$\Omega(n + n^2 \rho^2)$-результат** действителен, даже для оптимального атакующего алгоритма. Наши результаты показывают, что **дополнительные ссылочные данные** действительно дают злоумышленнику серьезную преимущество, особенно когда разница между выборкой и распределением небольшая. Это **первое утверждение**, что у атакующего может потребоваться **больше данных**, чем используется в обучении модели. Наша работа также показывает, что **ограничения на количество данных** могут негативно сказываться на безопасност
Annotation:
A membership-inference attack gets the output of a learning algorithm, and a target individual, and tries to determine whether this individual is a member of the training data or an independent sample from the same distribution. A successful membership-inference attack typically requires the attacker to have some knowledge about the distribution that the training data was sampled from, and this knowledge is often captured through a set of independent reference samples from that distribution. In ...
ID: 2508.19458v1 cs.LG, cs.CR, stat.ML