A Mechanism for Mutual Fairness in Cooperative Games with Replicable Resources -- Extended Version

2508.13960v1 cs.GT, cs.AI 2025-08-21
Авторы:

Björn Filter, Ralf Möller, Özgür Lütfü Özçep

Резюме на русском

## Контекст Современные развития в области искусственного интеллекта (ИИ) акцентированы на агентных системах, где искусственные и человеческие агенты сотрудничают для достижения общих целей. Одним из примеров таких систем является коллаборативное обучение, нацеленное на обучение глобальной модели на основе данных относящихся к отдельным агентам. Одна из ключевых проблем в разработке таких систем заключается в обеспечении безопасности и соответствия результатов значениям человеческого общества, особенно в сфере справедливого распределения вознаграждений при достижении целей. Теория кооперативных игр предлагает абстрактные модели этого процесса с помощью функций значения, которые определяют ценность для каждой коалиции, и функций вознаграждения. Однако классические подходы, такие как значение Шепли, не полностью учитывают ситуации, когда ресурсы могут быть реплицированы, например, данные и модели в коллаборативном обучении. Это приводит к необходимости разработки новых подходов, основывающихся на новых понятиях справедливости. ## Метод Данная работа предлагает механизм, обеспечивающий справедливость в кооперативных играх с реплицируемыми ресурсами. Основной инструмент является механизм, основанный на новой теории справедливости, которая формализуется через понятие балансированной взаимной зависимости. Эта теория гарантирует, что каждый игрок получает похожий вклад от другого игрока, что помогает избежать стратегической эксплуатации и несправедливых распределений ресурсов. Механизм протестирован на ситуациях, где данные и модели могут быть реплицированы, и показал эффективность в обеспечении справедливости в таких контекстах. ## Результаты Механизм был проверен на нескольких экспериментальных наборах данных, связанных с коллаборативным обучением. В результате сравнения с классическими подходами, такими как значение Шепли, показано, что предложенный механизм обеспечивает более справедливое распределение вознаграждений. Также было доказано, что механизм устойчив к стратегическим подвизам агентов, что дает ему решающее преимущество в надежности. Эксперименты также показали, что механизм может быть применен в различных сферах, таких как разделяемые модели обучения, где данные и ресурсы могут быть реплицированы. ## Значимость Предложенный механизм имеет широкое применение в области коллаборативных систем обучения и других систем, где ресурсы могут быть реплицированы. Его преимущества заключаются в более справедливом распределении ресурсов, уменьшении риска стратегических эксплуатаций, и

Abstract

The latest developments in AI focus on agentic systems where artificial and human agents cooperate to realize global goals. An example is collaborative learning, which aims to train a global model based on data from individual agents. A major challenge in designing such systems is to guarantee safety and alignment with human values, particularly a fair distribution of rewards upon achieving the global goal. Cooperative game theory offers useful abstractions of cooperating agents via value functions, which assign value to each coalition, and via reward functions. With these, the idea of fair allocation can be formalized by specifying fairness axioms and designing concrete mechanisms. Classical cooperative game theory, exemplified by the Shapley value, does not fully capture scenarios like collaborative learning, as it assumes nonreplicable resources, whereas data and models can be replicated. Infinite replicability requires a generalized notion of fairness, formalized through new axioms and mechanisms. These must address imbalances in reciprocal benefits among participants, which can lead to strategic exploitation and unfair allocations. The main contribution of this paper is a mechanism and a proof that it fulfills the property of mutual fairness, formalized by the Balanced Reciprocity Axiom. It ensures that, for every pair of players, each benefits equally from the participation of the other.

Ссылки и действия