A Mechanism for Mutual Fairness in Cooperative Games with Replicable Resources -- Extended Version
2508.13960v1
cs.GT, cs.AI
2025-08-21
Авторы:
Björn Filter, Ralf Möller, Özgür Lütfü Özçep
Резюме на русском
## Контекст
Современные развития в области искусственного интеллекта (ИИ) акцентированы на агентных системах, где искусственные и человеческие агенты сотрудничают для достижения общих целей. Одним из примеров таких систем является коллаборативное обучение, нацеленное на обучение глобальной модели на основе данных относящихся к отдельным агентам. Одна из ключевых проблем в разработке таких систем заключается в обеспечении безопасности и соответствия результатов значениям человеческого общества, особенно в сфере справедливого распределения вознаграждений при достижении целей. Теория кооперативных игр предлагает абстрактные модели этого процесса с помощью функций значения, которые определяют ценность для каждой коалиции, и функций вознаграждения. Однако классические подходы, такие как значение Шепли, не полностью учитывают ситуации, когда ресурсы могут быть реплицированы, например, данные и модели в коллаборативном обучении. Это приводит к необходимости разработки новых подходов, основывающихся на новых понятиях справедливости.
## Метод
Данная работа предлагает механизм, обеспечивающий справедливость в кооперативных играх с реплицируемыми ресурсами. Основной инструмент является механизм, основанный на новой теории справедливости, которая формализуется через понятие балансированной взаимной зависимости. Эта теория гарантирует, что каждый игрок получает похожий вклад от другого игрока, что помогает избежать стратегической эксплуатации и несправедливых распределений ресурсов. Механизм протестирован на ситуациях, где данные и модели могут быть реплицированы, и показал эффективность в обеспечении справедливости в таких контекстах.
## Результаты
Механизм был проверен на нескольких экспериментальных наборах данных, связанных с коллаборативным обучением. В результате сравнения с классическими подходами, такими как значение Шепли, показано, что предложенный механизм обеспечивает более справедливое распределение вознаграждений. Также было доказано, что механизм устойчив к стратегическим подвизам агентов, что дает ему решающее преимущество в надежности. Эксперименты также показали, что механизм может быть применен в различных сферах, таких как разделяемые модели обучения, где данные и ресурсы могут быть реплицированы.
## Значимость
Предложенный механизм имеет широкое применение в области коллаборативных систем обучения и других систем, где ресурсы могут быть реплицированы. Его преимущества заключаются в более справедливом распределении ресурсов, уменьшении риска стратегических эксплуатаций, и
Abstract
The latest developments in AI focus on agentic systems where artificial and
human agents cooperate to realize global goals. An example is collaborative
learning, which aims to train a global model based on data from individual
agents. A major challenge in designing such systems is to guarantee safety and
alignment with human values, particularly a fair distribution of rewards upon
achieving the global goal. Cooperative game theory offers useful abstractions
of cooperating agents via value functions, which assign value to each
coalition, and via reward functions. With these, the idea of fair allocation
can be formalized by specifying fairness axioms and designing concrete
mechanisms. Classical cooperative game theory, exemplified by the Shapley
value, does not fully capture scenarios like collaborative learning, as it
assumes nonreplicable resources, whereas data and models can be replicated.
Infinite replicability requires a generalized notion of fairness, formalized
through new axioms and mechanisms. These must address imbalances in reciprocal
benefits among participants, which can lead to strategic exploitation and
unfair allocations. The main contribution of this paper is a mechanism and a
proof that it fulfills the property of mutual fairness, formalized by the
Balanced Reciprocity Axiom. It ensures that, for every pair of players, each
benefits equally from the participation of the other.
Ссылки и действия
Дополнительные ресурсы: