Deploying Models to Non-participating Clients in Federated Learning without Fine-tuning: A Hypernetwork-based Approach

2508.12673v1 cs.LG, cs.AI 2025-08-20
Авторы:

Yuhao Zhou, Jindi Lv, Yuxin Tian, Dan Si, Qing Ye, Jiancheng Lv

Резюме на русском

## Контекст Federated Learning (FL) позволяет множеству участников обучать общую модель, сохраняя приватность данных. Однако этот подход становится сложнее в условиях хетерогенности данных, когда различия в распределении данных между клиентами могут привести к ухудшению качества обучения. Несмотря на то, что существующие методы успешно справляются с этим для участвующих клиентов, они часто не эффективны при работе с неучаствующими клиентами, у которых могут встречаться сдвиги распределений внутри домена и ограничения ресурсов. Это ограничение ограничивает расширяемость FL в реальных сценариях. ## Метод HyperFedZero предлагает инновационное решение, используя **hypernetwork-based approach** для динамического создания моделей, которые адаптируются к распределению данных неучаствующих клиентов. Метод основывается на использовании **NoisyEmbed-enhanced extractor**, который извлекает распределение-связанные признаки с помощью **Balancing Penalty**, чтобы избежать feature collapse. Эти признаки служат входными данными для **hypernetwork**, которая генерирует модели по частям (chunk-by-chunk). Это позволяет HyperFedZero легко адаптироваться к уникальным характеристикам неучаствующих клиентов без необходимости постоянного fine-tuning. ## Результаты Эксперименты проводились на различных датасетах и моделях, включая CIFAR-10 и ImageNet. Результаты показали, что HyperFedZero превосходит существующие методы, обеспечивая высокую точность при значительном сокращении оверхеда по вычислениям, хранению и связи. Анализ ablation studies подтвердил значимость каждого компонента, таких как NoisyEmbed и Balancing Penalty, для достижения эффективных и точных адаптаций. ## Значимость HyperFedZero открывает новые возможности для расширения FL в сценариях с неучаствующими клиентами. Он может применяться в области безопасного обучения, здравоохранения, финансовых системах и других секторах, где адаптация моделей к разным данным является критически важной. Этот подход обеспечивает минимальные затраты на ресурсы и способствует увеличению эффективности FL в реальной жизни. ## Выводы HyperFedZero достигает существенных улучшений в адаптации FL к неучаствующим клиентам без fine-tuning. Будущие исследования будут сфокусированы на расширении метода для других видов хетерогенности данных и увеличении скорости адаптации в реальном времени.

Abstract

Federated Learning (FL) has emerged as a promising paradigm for privacy-preserving collaborative learning, yet data heterogeneity remains a critical challenge. While existing methods achieve progress in addressing data heterogeneity for participating clients, they fail to generalize to non-participating clients with in-domain distribution shifts and resource constraints. To mitigate this issue, we present HyperFedZero, a novel method that dynamically generates specialized models via a hypernetwork conditioned on distribution-aware embeddings. Our approach explicitly incorporates distribution-aware inductive biases into the model's forward pass, extracting robust distribution embeddings using a NoisyEmbed-enhanced extractor with a Balancing Penalty, effectively preventing feature collapse. The hypernetwork then leverages these embeddings to generate specialized models chunk-by-chunk for non-participating clients, ensuring adaptability to their unique data distributions. Extensive experiments on multiple datasets and models demonstrate HyperFedZero's remarkable performance, surpassing competing methods consistently with minimal computational, storage, and communication overhead. Moreover, ablation studies and visualizations further validate the necessity of each component, confirming meaningful adaptations and validating the effectiveness of HyperFedZero.

Ссылки и действия