APFL: Analytic Personalized Federated Learning via Dual-Stream Least Squares

2508.10732v1 cs.LG, cs.AI 2025-08-16
Авторы:

Kejia Fan, Jianheng Tang, Zhirui Yang, Feijiang Han, Jiaxu Li, Run He, Yajiang Huang, Anfeng Liu, Houbing Herbert Song, Yunhuai Liu, Huiping Zhuang

Резюме на русском

## Контекст Personalized Federated Learning (PFL) является важной областью исследований в машинном обучении, нацеленной на создание персонализированных моделей для каждого клиента с привлечением к этому процессу совместного обучения. Однако существующие PFL-методы часто не могут справиться с проблемой не-IID данных, которая сильно повлияет на общую точность модели и ее персонализацию. Эта проблема становится особенно актуальной при работе с данными, характеризующимися сильным разрывом в распределении между клиентами. В этой работе мы предлагаем новый подход, называемый Analytic Personalized Federated Learning (APFL), который использует двухпоточный метод least squares для решения этой проблемы. ## Метод Метод APFL основывается на использовании фронт-енда на основе фундаментальной модели для извлечения признаков. Далее, процесс формирования модели делится на две части: глобальную общую структуру, основанную на shared primary stream, и локальную модель, специально для каждого клиента, разработанную на основе dedicated refinement stream. Значительная часть работы посвящена разработке аналитического подхода к решению проблемы не-IID данных. Благодаря этому, APFL обладает идеальным свойством робастности при различной степени не-IID распределения данных, что позволяет получить модели, которые достаточно термотологичны и идентичны даже при сильных различиях в распределении данных. ## Результаты Мы провели эксперименты на нескольких датасетах, включая MNIST, CIFAR-10, CINIC-10 и FEMNIST, чтобы проверить эффективность нашего подхода. Наши результаты показали, что APFL превосходит существующие базовые модели на холке 1.10%-15.45% в точности. Эти результаты демонстрируют эффективность нашего подхода в обеспечении персонализации моделей, даже при серьезных не-IID распределениях. ## Значимость Важность нашего работы заключается в том, что APFL может быть применен в различных приложениях, где необходимо обеспечить конфиденциальность и модельные мощности, не теряя точности. Это может быть широко применено в сферах, таких как медицина, финансовые услуги, искусственный интеллект, а также в ситуациях, где данные клиентов имеют сильно различное распределение. Благодаря своему уникальному подходу, APFL позволяет повысить производительность и сделать решения более гибкими и устойчивыми в условиях сильного разрыва данных. ## Выводы Предложенный APFL-подход доказал свою эффективность в решении проблемы не-IID данных в PFL. Мы планируем продолжить работу, улучшая модель, чтобы добиться еще большей гибкости и работы в реальных условиях. Будущие исследования будут направлены на расширение APFL для более сложных случаев не-IID данных и исследования новых аналитических моделей для персо

Abstract

Personalized Federated Learning (PFL) has presented a significant challenge to deliver personalized models to individual clients through collaborative training. Existing PFL methods are often vulnerable to non-IID data, which severely hinders collective generalization and then compromises the subsequent personalization efforts. In this paper, to address this non-IID issue in PFL, we propose an Analytic Personalized Federated Learning (APFL) approach via dual-stream least squares. In our APFL, we use a foundation model as a frozen backbone for feature extraction. Subsequent to the feature extractor, we develop dual-stream analytic models to achieve both collective generalization and individual personalization. Specifically, our APFL incorporates a shared primary stream for global generalization across all clients, and a dedicated refinement stream for local personalization of each individual client. The analytical solutions of our APFL enable its ideal property of heterogeneity invariance, theoretically meaning that each personalized model remains identical regardless of how heterogeneous the data are distributed across all other clients. Empirical results across various datasets also validate the superiority of our APFL over state-of-the-art baselines, with advantages of at least 1.10%-15.45% in accuracy.

Ссылки и действия