Adaptive Dual-Mode Distillation with Incentive Schemes for Scalable, Heterogeneous Federated Learning on Non-IID Data
2509.22507v1
cs.LG, cs.CV
2025-09-30
Авторы:
Zahid Iqbal
Резюме на русском
#### Контекст
Federated Learning (FL) является продвинутой методологией распределенного машинного обучения, позволяющей обучать модели на распределенных данных без нарушения конфиденциальности. Однако, FL сталкивается с рядом существенных проблем. Во-первых, не все устройства могут обучать одинаковые модели из-за различий в бизнес-требованиях и ресурсах вычислений. Во-вторых, статистическая неоднородность (non-IID data) становится ключевым фактором, который снижает качество глобальной модели. В-третьих, необходимо разработать экономичный и эффективный механизм поощрения, чтобы стимулировать участие клиентов в процессе обучения. В этой статье предлагается набор методологий для решения этих проблем.
#### Метод
Мы предлагаем три основных подхода: DL-SH, DL-MH и I-DL-MH.
- **DL-SH (Distributed Learning with Shared Models):** Это методология, ориентированная на эффективное обучение в условиях статистической неоднородности. Она использует упрощенные модели и методы эффективной связи, что позволяет значительно сократить объем передаваемых данных и поддерживать конфиденциальность.
- **DL-MH (Distributed Learning with Heterogeneous Models):** Данный подход рассчитан на полностью неоднородные модели, позволяя учесть различия в моделях клиентов. Он использует гибкие механизмы адаптации и взаимодействия для эффективного обучения в условиях статистической неоднородности.
- **I-DL-MH (Incentive-Based Distributed Learning with Heterogeneous Models):** Это расширение DL-MH, включающее систему поощрений для клиентов. Он мотивирует участие в обучении FL путем предоставления экономичных и функциональных выгод.
Методы были спроектированы, используя архитектуры сверточных и трансформерных моделей, а также технологии обеспечения приватности данных. Для тестирования использовались несколько датасетов (такие как MNIST, CIFAR-10), различные сценарии распределения данных (IID и несколько видов non-IID), а также различные варианты моделей.
#### Результаты
Проведенные эксперименты показали выдающиеся результаты. DL-SH улучшил точность глобальной модели на 153% в сравнении с традиционными методами, а DL-MH повысил точность на 180% при высокой статистической неоднородности. Инновационный подход I-DL-MH дал значительный прирост в точности — 225% при неоднородных данных, при этом снизив стоимость связи и улучшив удовлетворенность клиентов.
#### Значимость
Наша работа имеет широкие приложения в области децентрализованного машинного обучения, где требуется эффективность, конфиденциальность и стимулирование участия клиентов. Основные преимущества:
- Улучшенная точность глобальной модели в условиях non-IID данных.
- Значительное сокращение нак
Abstract
Federated Learning (FL) has emerged as a promising decentralized learning
(DL) approach that enables the use of distributed data without compromising
user privacy. However, FL poses several key challenges. First, it is frequently
assumed that every client can train the same machine learning models, however,
not all clients are able to meet this assumption because of differences in
their business needs and computational resources. Second, statistical
heterogeneity (a.k.a. non-IID data) poses a major challenge in FL, which can
lead to lower global model performance. Third, while addressing these
challenges, there is a need for a cost-effective incentive mechanism to
encourage clients to participate in FL training. In response to these
challenges, we propose several methodologies: DL-SH, which facilitates
efficient, privacy-preserving, and communication-efficient learning in the
context of statistical heterogeneity; DL-MH, designed to manage fully
heterogeneous models while tackling statistical disparities; and I-DL-MH, an
incentive-based extension of DL-MH that promotes client engagement in federated
learning training by providing incentives within this complex federated
learning framework. Comprehensive experiments were carried out to assess the
performance and scalability of the proposed approaches across a range of
complex experimental settings. This involved utilizing various model
architectures, in diverse data distributions, including IID and several non-IID
scenarios, as well as multiple datasets. Experimental results demonstrate that
the proposed approaches significantly enhance accuracy and decrease
communication costs while effectively addressing statistical heterogeneity and
model heterogeneity in comparison to existing state-of-the-art approaches and
baselines, with DL-SH improving global model accuracy by 153%, and I-DL-MH
achieving a 225% improvement under non-IID conditions.
Ссылки и действия
Дополнительные ресурсы: