FedAVOT: Exact Distribution Alignment in Federated Learning via Masked Optimal Transport

2509.14444v1 cs.LG, stat.ML 2025-09-20

Авторы:

Herlock, Rahimi, Dionysis Kalogerias

Резюме на русском

## Контекст Federated Learning (FL) — это методология распределенного обучения моделей, позволяющая обучать модели на распределенных данных без передачи исходных данных с клиентских устройств на сервер. Однако FL сталкивается с значительными проблемами при неполной участие клиентов в обучении. Так, например, распределение доступных пользователей (availability distribution, $q$) часто не совпадает с распределением, определяющим оптимизационный запрос (importance distribution, $p$). Это влечет за собой несбалансированность и нестабильность обновлений модели при использовании классического FedAvg. Данная проблема приводит к ухудшению качества модели, особенно в таких сценариях, как разнообразные данные, сценарии, требующие справедливости, и сценарии с ограниченным количеством участвующих клиентов. Для решения этих проблем предлагается FedAVOT — методом, основанный на принципах транспортного теоремы Оттлинга (optimal transport, OT), чтобы улучшить агрегацию в FL. ## Метод FedAVOT оптимизирует процесс агрегации в FL с использованием теории транспортной задачи Оттлинга, которая позволяет скорректировать распределения $q$ и $p$ для синхронизированной агрегации моделей. Основной инструментом является метод Sinkhorn scaling, который позволяет вычислить веса агрегации, исходя из транспортной задачи. Это способствует получению производственных, добротных и стабильных обновлений модели, даже при минимальном количестве участвующих клиентов. Формализм FedAVOT гарантирует проверенную сходимость $\mathcal{O}(1/\sqrt{T})$ в несмотримой схеме с обучением, не зависящую от количества участвующих клиентов за каждый раунд. Этот подход обеспечивает улучшение качества модели в сценариях, где клиенты нечасто участвуют или где распределение данных сильно отличается от целевого распределения. ## Результаты Исследования по FedAVOT проводились на различных симуляционных и реальных данных, включая сценарии с небольшим количеством участвующих клиентов и сценарии с неодинаковыми распределениями данных. Результаты показали, что FedAVOT превосходит FedAvg на различных метриках качества модели, включая точность и справедливость. Например, в сценарии с низким уровнем участия клиентов, FedAVOT показал серьезные выигрыши по сравнению с FedAvg, даже при числе участвующих клиентов в раунде одного или двух. Также, FedAVOT продемонстрировал улучшение справедливости модели в сценариях, где требуется сбалансированное распределение между различными подгруппами клиентов. ## Значимость FedAVOT может быть применен в различных областях, где требуется эффективное обучение моделей с распределенными данными, но с ограниченным участием клиентов. Например, в сферах, где д

Abstract

Federated Learning (FL) allows distributed model training without sharing raw data, but suffers when client participation is partial. In practice, the distribution of available users (\emph{availability distribution} $q$) rarely aligns with the distribution defining the optimization objective (\emph{importance distribution} $p$), leading to biased and unstable updates under classical FedAvg. We propose \textbf{Fereated AVerage with Optimal Transport (\textbf{FedAVOT})}, which formulates aggregation as a masked optimal transport problem aligning $q$ and $p$. Using Sinkhorn scaling, \textbf{FedAVOT} computes transport-based aggregation weights with provable convergence guarantees. \textbf{FedAVOT} achieves a standard $\mathcal{O}(1/\sqrt{T})$ rate under a nonsmooth convex FL setting, independent of the number of participating users per round. Our experiments confirm drastically improved performance compared to FedAvg across heterogeneous, fairness-sensitive, and low-availability regimes, even when only two clients participate per round.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

FedAVOT: Exact Distribution Alignment in Federated Learning via Masked Optimal Transport

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Breaking Determinism: Stochastic Modeling for Reliable Off-Policy Evaluation in ...

Tuning-Free Structured Sparse Recovery of Multiple Measurement Vectors using Imp...

GaussDetect-LiNGAM:Causal Direction Identification without Gaussianity test

Parameter-Efficient Augment Plugin for Class-Incremental Learning

Mitigating the Curse of Detail: Scaling Arguments for Feature Learning and Sampl...

Навигация