Optimization Methods and Software for Federated Learning
2509.08120v1
cs.LG, math.OC, G.4; D.2; G.m; G.3; I.2
2025-09-12
Авторы:
Konstantin Burlachenko
Резюме на русском
## Контекст
Federated Learning (FL) является современным, мультидисциплинарным подходом в области машинного обучения, в котором несколько клиентов, таких как мобильные устройства, объединяют свои ресурсы для решения общих задач машинного обучения. Этот подход был впервые представлен в работах Konečný et al. (2016a,b) и McMahan et al. (2017) и получил повышенное внимание благодаря включению в National AI Research and Development Strategic Plan (2023 Update) США (Science and Artificial Intelligence, 2023). FL отличается от традиционных методов машинного обучения тем, что он работает в распределенной среде с менее строгими условиями управления, чем централизованные системы. Это приводит к уникальным проблемам, включая неоднородность данных и устройств, проблемы связи и требования к защите приватности. Наша исследовательская мотивация состоит в том, чтобы развить эффективные методы, способные справиться с этими проблемами и улучшить реалистичность FL в реальных условиях.
## Метод
Мы разработали и анализировали многочисленные методологии, нацеленные на улучшение производительности FL. Наша методология включает в себя развитие новых алгоритмов для обработки неоднородности данных и устройств, а также методы, улучшающие стабильность связи и эффективность обучения в условиях плохой связи. Мы также разработали системные решения для упрощения развертывания FL в разных средах. Наши технические решения основываются на детальном анализе существующих теоретических моделей FL, которые мы расширили, добавив новые функции и адаптируя методы под конкретные задачи и ограничения. Этот подход позволял нам создавать алгоритмы, которые не только работают хорошо в теории, но и доказывают свою эффективность в реальных условиях.
## Результаты
Мы провели ряд экспериментов на различных наборах данных и симулированных средах, сравнивая наши решения с имеющимися методами. Наши эксперименты показали, что разработанные методы приводят к значительным улучшениям в скорости обучения, точности результатов и эффективности использования ресурсов. Например, в одном из экспериментов, проводившемся на данных реальных мобильных устройств, наши методы уменьшили время обучения в среднем на 30% по сравнению с лучшими существующими решениями. Мы также оценили влияние нашей архитектуры на защиту приватности и показали, что она обеспечивает более высокий уровень защиты в сравнении с альтернативными подходами.
## Значимость
Результаты настоящего исследования имеют широкое применение в различных областях, включая мобильные устройства, Интернет вещей и здравоохранение. FL позволяет эффективно использовать данные, не требуя их цен
Abstract
Federated Learning (FL) is a novel, multidisciplinary Machine Learning
paradigm where multiple clients, such as mobile devices, collaborate to solve
machine learning problems. Initially introduced in Kone{\v{c}}n{\'y} et al.
(2016a,b); McMahan et al. (2017), FL has gained further attention through its
inclusion in the National AI Research and Development Strategic Plan (2023
Update) of the United States (Science and on Artificial Intelligence, 2023).
The FL training process is inherently decentralized and often takes place in
less controlled settings compared to data centers, posing unique challenges
distinct from those in fully controlled environments. In this thesis, we
identify five key challenges in Federated Learning and propose novel approaches
to address them. These challenges arise from the heterogeneity of data and
devices, communication issues, and privacy concerns for clients in FL training.
Moreover, even well-established theoretical advances in FL require diverse
forms of practical implementation to enhance their real-world applicability.
Our contributions advance FL algorithms and systems, bridging theoretical
advancements and practical implementations. More broadly, our work serves as a
guide for researchers navigating the complexities of translating theoretical
methods into efficient real-world implementations and software. Additionally,
it offers insights into the reverse process of adapting practical
implementation aspects back into theoretical algorithm design. This reverse
process is particularly intriguing, as the practical perspective compels us to
examine the underlying mechanics and flexibilities of algorithms more deeply,
often uncovering new dimensions of the algorithms under study.