Gaming and Cooperation in Federated Learning: What Can Happen and How to Monitor It
2509.02391v1
cs.LG, cs.GT, stat.ML
2025-09-06
Авторы:
Dongseok Kim, Wonjun Jeong, Gisung Oh
Резюме на русском
## Контекст
Federated Learning (FL) является важной методологией в области машинного обучения, позволяющей обучать модели на распределенных данных, обеспечивая при этом приватность данных участников. Однако, успех FL часто зависит от поведения участников, которое может быть непредсказуемым и целенаправленным. Участники могут искажать результаты обучения, например, в ущерб общей модели, чтобы оптимизировать метрики, которые оценивают их вклад. Такое поведение, известное как "gaming" (игра), может привести к снижению качества модели и ухудшению ее работы в реальной среде. Необходима система мониторинга, которая позволит определять и интерпретировать подобные попытки игры, чтобы предотвратить их и сохранить доверие в системе.
## Метод
Мы развиваем аналитический фреймворк, который рассматривает FL не только как задачу оптимизации, но и как стратегическую систему с правилами и инстинктами. Мы предлагаем два индекса: **Incentive Index (Индекс стимулов)**, оценивающий степень целесообразности поддельных действий, и **Performance Loss Index (Индекс потерь производительности)**, измеряющий фактический вклад в общую производительность. Эти индексы позволяют оценивать поведение участников в различных условиях. Мы также разрабатываем алгоритм для распределения ресурсов аудита, чтобы эффективно отслеживать и обнаруживать подозрительные участников. Далее, мы формулируем ранние сигналы о подозрительном поведении, которые могут быть использованы для активной мониторинга.
## Результаты
Мы проводим эксперименты на различных симуляционных средах, включая те, где участники играют на коллективную потерю, и другие, где индивидуальные игры преимущественно стимулируются. Наши результаты показывают, что индексы могут точно выявлять игровые попытки в различных условиях. Мы также проверяем эффективность алгоритма распределения ресурсов аудита, который позволяет оптимизировать ресурсы для мониторинга. Кроме того, мы определяем пороговые значения, автоматические правила переключения, и ранние сигналы, которые могут быть использованы для простого интегрирования в реальные ситуации.
## Значимость
Наши находки могут быть применены в различных сферах, включая распределенные системы, игровые сценарии, и даже корпоративные среды, где участники могут искажать результаты для выгоды. Мы показываем, что наш подход позволяет повысить доверие к FL, уменьшить стимулы для метрической игры, и обеспечить консистентную производительность. Мы также подчеркиваем, что целесообразность наших рекомендаций зависит от того, насколько участники могут быть способны оценить каждую ситуацию и принять
Abstract
The success of Federated Learning depends on the actions that participants
take out of sight. We model Federated Learning not as a mere optimization task
but as a strategic system entangled with rules and incentives. From this
perspective, we present an analytical framework that makes it possible to
clearly identify where behaviors that genuinely improve performance diverge
from those that merely target metrics. We introduce two indices that
respectively quantify behavioral incentives and collective performance loss,
and we use them as the basis for consistently interpreting the impact of
operational choices such as rule design, the level of information disclosure,
evaluation methods, and aggregator switching. We further summarize thresholds,
auto-switch rules, and early warning signals into a checklist that can be
applied directly in practice, and we provide both a practical algorithm for
allocating limited audit resources and a performance guarantee. Simulations
conducted across diverse environments consistently validate the patterns
predicted by our framework, and we release all procedures for full
reproducibility. While our approach operates most strongly under several
assumptions, combining periodic recalibration, randomization, and
connectivity-based alarms enables robust application under the variability of
real-world operations. We present both design principles and operational
guidelines that lower the incentives for metric gaming while sustaining and
expanding stable cooperation.
Ссылки и действия
Дополнительные ресурсы: