Enhancing Communication Efficiency in FL with Adaptive Gradient Quantization and Communication Frequency Optimization

2509.23419v1 cs.DC, cs.AI 2025-10-01
Авторы:

Asadullah Tariq, Tariq Qayyum, Mohamed Adel Serhani, Farag Sallabi, Ikbal Taleb, Ezedin S. Barka

Резюме на русском

## Контекст Federated Learning (FL) представляет собой метод обучения моделей с поддержкой нескольких участников, где устройства принимают участие в обучении модели без передачи личных данных на сервер. Это решение позволяет улучшить защиту данных и решить проблему вычислительных ресурсов. Однако FL сталкивается с ограничениями, одним из ключевых из которых является высокий объем обмена данными, который будет требоваться для периодических обновлений моделей между устройствами и сервером. Это препятствует развертыванию FL в сетях с ограниченными ресурсами. Поэтому, в условиях доступа к данным в реальных сетях, необходимо разработать методы, которые позволяют уменьшить объем обмена данными, оставив модель эффективной и точной. ## Метод В этой работе мы предлагаем улучшить эффективность FL с помощью трех основных моделей. Во-первых, мы предлагаем **Adaptive Feature-Elimination Strategy**, которая удаляет менее важные фичи, оставляя те, которые действительно влияют на подготовленную модель. Во-вторых, **Adaptive Gradient Innovation and Error Sensitivity-Based Quantization**, которая динамически подстраивает уровень компрессии градиентов, чтобы сохранять только собственные инновации градиента. В-третьих, **Communication Frequency Optimization**, которая стремится оптимизировать частоту обмена данными между устройствами и сервером. Эти три модели, применяемые в сочетании, нацелены на уменьшение коммуникационного накладных расходов, при этом сохраняя точность и качество модели. ## Результаты Мы провели широкие эксперименты для оценки нашей модели. Мы сопоставили ее с основными методами, оценив качество модели по следующим показателям: точность, потери и вырождение. Изменения в коммуникационной частоте и воздействии новых методов на эти различные показатели были зафиксированы. Эксперименты показали, что наша модель обеспечивает высокую эффективность коммуникации, сохраняя эффективность и точность, что делает ее привлекательной для применения в сетях с ограниченными ресурсами. ## Значимость Наша модель может применяться в различных областях, таких как медицина, мобильные системы, и вычисления в реальном времени. Она делает FL более эффективной и доступной для развертывания в реальных сетях. Благодаря нашей модели, можно улучшить скорость обучения и сократить расходы на связь, что делает FL более привлекательным для использования в реальных условиях, особенно в сетях с ограниченными ресурсами. ## Выводы Мы привносили новую стратегию для улучшения коммуникационной эффективности в FL. Модель **Adaptive Feature-Elimination Strategy**, **Adaptive Gradient Innovation and Error Sensitivity-Based Quantization** и **Communication Frequency Optimization** позволяют эффективно снизить потери в модели, оставив основные важные элементы. В будущем мы намереваемся расширить эти методы, учитывая более слож

Abstract

Federated Learning (FL) enables participant devices to collaboratively train deep learning models without sharing their data with the server or other devices, effectively addressing data privacy and computational concerns. However, FL faces a major bottleneck due to high communication overhead from frequent model updates between devices and the server, limiting deployment in resource-constrained wireless networks. In this paper, we propose a three-fold strategy. Firstly, an Adaptive Feature-Elimination Strategy to drop less important features while retaining high-value ones; secondly, Adaptive Gradient Innovation and Error Sensitivity-Based Quantization, which dynamically adjusts the quantization level for innovative gradient compression; and thirdly, Communication Frequency Optimization to enhance communication efficiency. We evaluated our proposed model's performance through extensive experiments, assessing accuracy, loss, and convergence compared to baseline techniques. The results show that our model achieves high communication efficiency in the framework while maintaining accuracy.

Ссылки и действия