Robust Federated Learning under Adversarial Attacks via Loss-Based Client Clustering

2508.12672v2 cs.LG, cs.AI 2025-08-20

Авторы:

Emmanouil Kritharakis, Dusan Jakovetic, Antonios Makris, Konstantinos Tserpes

Резюме на русском

## Контекст Federated Learning (FL) — это методология, позволяющая обучать модели с помощью нескольких участников (клиентов), не раскрывая личных данных. Однако FL чувствителен к атакам, особенно в сценариях, когда клиенты могут быть злонамеренными (Byzantine). Это важно в ситуациях, когда сервер имеет доверенные данные до начала федеративного обучения или когда один клиент может выступать в роли доверенного сервера. Обычные методы, такие как Mean, Trimmed Mean, Median, Krum и Multi-Krum, недостаточно эффективны при атаках, таких как label flipping, sign flipping и Gaussian noise. Наша работа стремится создать устойчивый подход к FL в условиях атак, используя loss-based client clustering. ## Метод Мы предлагаем алгоритм, основанный на кластеризации клиентов на основе их loss-функций. Данный подход позволяет определить два доверенных участника — сервер и один клиент — для корректного функционирования FL, не требуя предварительного знания об окружающих атаках. Мы разработали теоретические модели, установив ограничения оптимальности алгоритма даже при сильных Byzantine attacks. Техническая сторона решения включает в себя функциональную кластеризацию, loss-based filtering и устойчивые аппроксимации. ## Результаты Мы провели эксперименты на MNIST, FMNIST и CIFAR-10, используя Flower framework. Наш алгоритм демонстрирует значительное превосходство по сравнению с существующими методами, включая Mean, Trimmed Mean, Median, Krum и Multi-Krum. Мы проверили надежность алгоритма под различными атаками, такими как label flipping, sign flipping и Gaussian noise. Наши результаты показывают, что технология loss-based client clustering не только улучшает точность моделей, но и обеспечивает высокую устойчивость к злонамеренным клиентам. ## Значимость Наш подход может быть применен в любых сценариях FL, где клиенты могут быть злонамеренными. Он значительно улучшает устойчивость FL к атакам, не требуя дополнительных предположений о числе злонамеренных клиентов. Полученные результаты открывают новые возможности для применения FL в реальных ситуациях, таких как банковская сфера, здравоохранение и транспорт. Это демонстрирует потенциал FL для устойчивой и эффективной обработки данных в условиях атак. ## Выводы Мы предложили новый подход к обеспечению устойчивости FL в условиях атак. Наши эксперименты показали, что loss-based client clustering значительно превосходит существующие методы. Будущие исследования будут сконцентрированы на улучшении кластеризации и расширении применимости нашего подхода к более сложным сценариям FL.

Abstract

Federated Learning (FL) enables collaborative model training across multiple clients without sharing private data. We consider FL scenarios wherein FL clients are subject to adversarial (Byzantine) attacks, while the FL server is trusted (honest) and has a trustworthy side dataset. This may correspond to, e.g., cases where the server possesses trusted data prior to federation, or to the presence of a trusted client that temporarily assumes the server role. Our approach requires only two honest participants, i.e., the server and one client, to function effectively, without prior knowledge of the number of malicious clients. Theoretical analysis demonstrates bounded optimality gaps even under strong Byzantine attacks. Experimental results show that our algorithm significantly outperforms standard and robust FL baselines such as Mean, Trimmed Mean, Median, Krum, and Multi-Krum under various attack strategies including label flipping, sign flipping, and Gaussian noise addition across MNIST, FMNIST, and CIFAR-10 benchmarks using the Flower framework.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Robust Federated Learning under Adversarial Attacks via Loss-Based Client Clustering

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Prototype-Based Semantic Consistency Alignment for Domain Adaptive Retrieval

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

TimesNet-Gen: Deep Learning-based Site Specific Strong Motion Generation

Realizable Abstractions: Near-Optimal Hierarchical Reinforcement Learning

BEP: A Binary Error Propagation Algorithm for Binary Neural Networks Training

Навигация