📊 Статистика дайджестов

Всего дайджестов: 34022 Добавлено сегодня: 82

Последнее обновление: сегодня

📄 Computing Evolutionarily Stable Strategies in Multiplayer Games

2025-11-27

Авторы:

Sam Ganzfried

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

We present an algorithm for computing all evolutionarily stable strategies in nondegenerate normal-form games with three or more players.

ID: 2511.20859v1 cs.GT, cs.AI, cs.MA, econ.TH, q-bio.PE

arXiv PDF

📄 Quadratic Programming Approach for Nash Equilibrium Computation in Multiplayer Imperfect-Information Games

2025-10-02

Авторы:

Sam Ganzfried

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

There has been significant recent progress in algorithms for approximation of Nash equilibrium in large two-player zero-sum imperfect-information games and exact computation of Nash equilibrium in multiplayer strategic-form games. While counterfactual regret minimization and fictitious play are scalable to large games and have convergence guarantees in two-player zero-sum games, they do not guarantee convergence to Nash equilibrium in multiplayer games. We present an approach for exact computati...

ID: 2509.25618v1 cs.GT, cs.AI, cs.MA

arXiv PDF

📄 Diversity of Structured Domains via k-Kemeny Scores

2025-09-23

Авторы:

Piotr Faliszewski, Krzysztof Sornat, Stanisław Szufa, Tomasz Wąs

## Контекст Область исследования связана с анализом голосований и поиском оптимальных стратегий для определения минимального числа перестановок, необходимых для сглаживания разнообразия в голосовании. Изучаются структурированные домены, такие как single-peaked, single-crossing, group-separable и Euclidean, которые часто встречаются в реальных ситуациях. Задача состоит в том, чтобы оптимизировать критерий Kemeny, предназначенный для оценки разнообразия результатов. Недостаток универсальных методов в этой области создает мотивацию для разработки более точных алгоритмов, которые могут обеспечить более четкую оценку разнообразия в голосованиях. ## Метод Алгоритм k-Kemeny используется для оптимизации разнообразия голосования, определяя минимальное число перестановок, необходимых для сглаживания результатов. Методология основывается на изучении голосований в различных структурированных доменах. Архитектура решения заключается в применении математических моделей для вычисления Kemeny-скорости и определения минимального числа необходимых перестановок. Эта архитектура включает в себя сложные вычисления голосований в разных структурах и оптимизацию поиска наилучших решений. ## Результаты Для разных структурированных доменов было проведено ряд экспериментов, включая single-peaked, single-crossing, group-separable и Euclidean. На этих тестовых наборах был проведен анализ разнообразия результатов, определяя минимальное число перестановок, необходимых для оптимизации Kemeny-скорости. Результаты показали, что для большинства доменов k-Kemeny остается нетривиальным даже при k=2, что говорит о сложности этой задачи в разных структурах. Также был выполнен сравнительный анализ разнообразия в разных структурах. ## Значимость Результаты этого исследования имеют широкое применение в области анализа голосований и оптимизации результатов в различных структурах. Изучение разнообразия в структурированных доменах позволяет понять не только степень сглаживания результатов, но и определить характеристики каждого домена. Полученные результаты могут быть использованы для оптимизации голосований в реальных условиях, где требуется максимально точное определение разнообразия. Кроме того, данные результаты могут быть применены в других областях, где требуется анализ структурных особенностей голосований. ## Выводы Изучение разнообразия в структурированных доменах позволило выявить характеристики каждого домена и сформулировать рекомендации для оптимизации результатов голосований. Однако, несмотря на достижения, остаются неразрешимые проблемы, которые требуют более подробного исследования, такие как улучшение точно

Annotation:

In the k-Kemeny problem, we are given an ordinal election, i.e., a collection of votes ranking the candidates from best to worst, and we seek the smallest number of swaps of adjacent candidates that ensure that the election has at most k different rankings. We study this problem for a number of structured domains, including the single-peaked, single-crossing, group-separable, and Euclidean ones. We obtain two kinds of results: (1) We show that k-Kemeny remains intractable under most of these dom...

ID: 2509.15812v1 cs.GT, cs.AI, cs.MA

arXiv PDF

📄 Consistent Opponent Modeling of Static Opponents in Imperfect-Information Games

2025-08-27

Авторы:

Sam Ganzfried

## Контекст В многоагентных средах, где агенты стремятся максимизировать свою награду, игра стратегических агентов часто определяется игровыми теоретическими понятиями, такими как Нашее эквибриум. Однако эти подходы нередко не учитывают исторические данные и наблюдаемые данные от противников во время повторных взаимодействий. Наблюдения за противником могут предоставить ценную информацию для улучшения стратегии. Однако в играх с неполной информацией, где информация о действиях противника не всегда видна, эффективность таких подходов ограничена. Это снижает потенциал игровых агентов в условиях неопределенности, например, в покере. Мы исследуем проблему того, как создавать модели противников, которые бы не только учитывали исторические данные, но и стабильно приближались к истинной стратегии противника в течение продолжительного времени. ## Метод Мы предлагаем алгоритм ориентированный на моделирование противников, гарантирующий точное настройку на истинную стратегию противника в игре с неполной информацией. Наш подход основывается на последовательности-форме игрового представления, которое позволяет представить игру в виде многоугольника. Мы используем оптимизационный метод градиентного спуска с проекцией, чтобы минимизировать разницу между стратегией модели и истинной стратегией противника. Ключевым элементом является то, что наш метод гарантирует сходимость к точной стратегии противника с увеличением количества игровых итераций, даже в случае нестабильных противников. ## Результаты Мы проводим эксперименты на наборе задач, включающих игры с неполной информацией, такие как покер. Для этого мы используем набор данных, содержащий наблюдения за игровыми действиями противников в течение многих игровых сессий. Наши результаты показывают, что наш алгоритм эффективно приближается к истинной стратегии противника, даже если противник нестабилен. Мы также проверяем нашу модель на задачах, где противник отличается от предыдущих сессий, и показываем, что алгоритм успешно адаптируется. ## Значимость Наш подход может быть применен в различных многоагентных системах, где агенты должны реагировать на противников, основываясь на исторических данных. Например, он может быть использован в игровых системах, интеллектуальных ассистентах, системах управления трафиком или даже в системах безопасности. Наш подход обеспечивает более высокую точность и стабильность в моделировании противников, что может повысить эффективность таких систем. Это также открывает новые возможности для улучшения интеллектуальных систем в различных

Annotation:

The goal of agents in multi-agent environments is to maximize total reward against the opposing agents that are encountered. Following a game-theoretic solution concept, such as Nash equilibrium, may obtain a strong performance in some settings; however, such approaches fail to capitalize on historical and observed data from repeated interactions against our opponents. Opponent modeling algorithms integrate machine learning techniques to exploit suboptimal opponents utilizing available data; how...

ID: 2508.17671v2 cs.GT, cs.AI, cs.MA, econ.TH

arXiv PDF

📄 Not in My Backyard! Temporal Voting Over Public Chores

2025-08-14

Авторы:

Edith Elkind, Tzeh Yuan Neoh, Nicholas Teh

#### Контекст Многие общественные проекты, такие как строительство дорог или сбор мусора, носят общеблагоприятный характер, но при этом могут вызывать отрицательные последствия для конкретных групп населения. Эти проекты, называемые "публичными хлопьями" (public chores), требуют от их участников вкладывать время, деньги или усилия. Тем не менее, их выполнение часто приводит к возражениям от тех, кто не желает платить цену за выгоду других. В модели "Not in My Backyard!" (NIMBY) исследователи изучают вопросы выбора и временного распределения таких проектов, учитывая динамические предпочтения участников. Особое внимание уделяется сложности вычислений для оптимизации социального блага и равенства. #### Метод В модели исследования участники имеют динамические предпочтения по отношению к проектам, которые могут производить пользу, но также вносить негативные последствия. Исследователи используют модель "темпорального голосования" (temporal voting), где каждый проект имеет свой штраф и польза, которые меняются во времени. Методология включает анализ сложности вычислений для оптимального распределения проектов с учетом этих динамических предпочтений. Решения разделяются на точные, приближенные и эвристические. Особое внимание уделяется ситуациям, где модель может быть эффективно решена, и к факторам влияющим на то, как сильно голосование влияет на социальное благо. #### Результаты Исследователи выявили, что оптимизация утилитарного блага (то есть максимизация всей пользы для общества) является простой задачей, которую можно решить в линейном времени. Однако оптимизация равенства (максимизация минимального блага для любого участника) оказалась гораздо сложнее и в большинстве случаев является вычислительно нерешаемой (NP-трудно). Тем не менее, в некоторых ограниченных случаях были найдены эффективные алгоритмы для ее решения. Исследователям удалось также проанализировать влияние временной справедливости (temporal fairness) на социальное благо и изучить эффективность онлайн-алгоритмов, работающих с динамическими входными данными. #### Значимость Результаты имеют широкие применения в области управления общественными ресурсами и принятия решений в условиях неопределенности. Например, модель может применяться для решения проблем с размещением общественных проектов, где необходимо учитывать временные предпочтения участников. Одним из основных преимуществ является возможность эффективного распределения ресурсов с учетом временных изменений предпочтений. Будущие исследования могут сосредоточиться на улучшении алгоритмов для более сложных случаев и на изучении других методов, которые могут повысить сп

Annotation:

We study a temporal voting model where voters have dynamic preferences over a set of public chores -- projects that benefit society, but impose individual costs on those affected by their implementation. We investigate the computational complexity of optimizing utilitarian and egalitarian welfare. Our results show that while optimizing the former is computationally straightforward, minimizing the latter is computationally intractable, even in very restricted cases. Nevertheless, we identify seve...

ID: 2508.08810v1 cs.GT, cs.AI, cs.MA, econ.TH

arXiv PDF

📄 Approximate Proportionality in Online Fair Division

2025-08-06

Авторы:

Davin Choo, Winston Fu, Derek Khu, Tzeh Yuan Neoh, Tze-Yang Poon, Nicholas Teh

Данная статья рассматривает проблему онлайн-распределения ресурсов, где неделимые объекты должны быть немедленно и необратимо распределены между агентами. Классические понятия справедливости, такие как envy-freeness и maximin share fairness, не могут быть эффективно приближены в этой области. Авторы фокусируются на пропорциональности с учётом одного дополнительного ресурса (PROP1), которая представляет собой более легкую для достижения форму справедливости. Исследуются три естественных жадных алгоритма, которые оказываются неэффективными против адаптивных противников. Однако, при использовании неадаптивных противников или дополнительной информации, такой как предсказания максимального значения ресурса (MIV), можно достичь значимого приближения к PROP1. Несмотря на это, более строгие формы справедливости, такие как EF1, MMS и PROPX, остаются недостижимыми даже с идеальными предсказаниями.

Annotation:

We study the online fair division problem, where indivisible goods arrive sequentially and must be allocated immediately and irrevocably to agents. Prior work has established strong impossibility results for approximating classic fairness notions, such as envy-freeness and maximin share fairness, in this setting. In contrast, we focus on proportionality up to one good (PROP1), a natural relaxation of proportionality whose approximability remains unresolved. We begin by showing that three natural...

ID: 2508.03253v1 cs.GT, cs.AI, cs.MA

arXiv PDF