📊 Статистика дайджестов

Всего дайджестов: 34123 Добавлено сегодня: 101

Последнее обновление: сегодня

📄 Solving Neural Min-Max Games: The Role of Architecture, Initialization & Dynamics

2025-12-02

Авторы:

Deep Patel, Emmanouil-Vasileios Vlatakis-Gkaragkounis

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

Many emerging applications - such as adversarial training, AI alignment, and robust optimization - can be framed as zero-sum games between neural nets, with von Neumann-Nash equilibria (NE) capturing the desirable system behavior. While such games often involve non-convex non-concave objectives, empirical evidence shows that simple gradient methods frequently converge, suggesting a hidden geometric structure. In this paper, we provide a theoretical framework that explains this phenomenon through...

ID: 2512.00389v1 cs.LG, cs.GT, stat.ML

arXiv PDF

📄 Look-Ahead Reasoning on Learning Platforms

2025-11-20

Авторы:

Haiqing Zhu, Tijana Zrnic, Celestine Mendler-Dünner

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

On many learning platforms, the optimization criteria guiding model training reflect the priorities of the designer rather than those of the individuals they affect. Consequently, users may act strategically to obtain more favorable outcomes, effectively contesting the platform's predictions. While past work has studied strategic user behavior on learning platforms, the focus has largely been on strategic responses to a deployed model, without considering the behavior of other users. In contrast...

ID: 2511.14745v1 cs.LG, cs.GT, stat.ML

arXiv PDF

📄 Data Reliability Scoring

2025-10-22

Авторы:

Yiling Chen, Shi Feng, Paul Kattuman, Fang-Yi Yu

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

How can we assess the reliability of a dataset without access to ground truth? We introduce the problem of reliability scoring for datasets collected from potentially strategic sources. The true data are unobserved, but we see outcomes of an unknown statistical experiment that depends on them. To benchmark reliability, we define ground-truth-based orderings that capture how much reported data deviate from the truth. We then propose the Gram determinant score, which measures the volume spanned by...

ID: 2510.17085v1 cs.LG, cs.GT, stat.ML

arXiv PDF

📄 Tight Regret Upper and Lower Bounds for Optimistic Hedge in Two-Player Zero-Sum Games

2025-10-15

Авторы:

Taira Tsuchiya

Саммари на русском не найдено
Доступные поля: ['id', 'arxiv_id', 'title', 'authors', 'abstract', 'summary_ru', 'categories', 'published_date', 'created_at']

Annotation:

In two-player zero-sum games, the learning dynamic based on optimistic Hedge achieves one of the best-known regret upper bounds among strongly-uncoupled learning dynamics. With an appropriately chosen learning rate, the social and individual regrets can be bounded by $O(\log(mn))$ in terms of the numbers of actions $m$ and $n$ of the two players. This study investigates the optimality of the dependence on $m$ and $n$ in the regret of optimistic Hedge. To this end, we begin by refining existing r...

ID: 2510.11691v1 cs.LG, cs.GT, stat.ML

arXiv PDF

📄 Calibration through the Lens of Indistinguishability

2025-09-06

Авторы:

Parikshit Gopalan, Lunjia Hu

## Контекст Рассмотрение проблемы calibration в статье "Calibration through the Lens of Indistinguishability" возникает в контексте традиционного сообщества по прогнозированию, которое рассматривает вопросы, связанные с интерпретацией прогнозируемых вероятностей. В неизбежной неопределенности мира, где прогнозы представляются в виде вероятностей, а реальные результаты происходят в виде дискретных выборов, возникает вопрос о том, как должны быть оценены прогнозы вероятностей. Эта проблема становится все актуальнее в связи с появлением в машинном обучении и других областях искусственного интеллекта вероятностных прогнозов. В статье авторы рассматривают альтернативный взгляд на моделирование и оценку прогнозирования под названием "indistinguishability" (неотличимость), которая позволяет понимать как процесс прогнозирования, так и меры качества прогнозов в целом. ## Метод Подход, изложенный в статье, основывается на идее неотличимости мира, прогнозируемого моделью, и реального мира. Качество прогноза оценивается на основе способности отличить данные, полученные от прогнозирующей модели, от реальных данных, полученных от "оптимального" прогнозирующего модели. Для этого авторы предлагают вводить различные меры неотличимости, которые позволяют измерить разницу между этими двумя мирами. Основная идея заключается в том, что если модель прогнозирует неверную вероятность, то она становится неотличимой от истинного мира. Альтернативный подход, предложенный в статье, заключается в использовании методов, позволяющих оценить качество прогноза, не только с помощью мер качества (как precision и recall), но и с помощью мер неотличимости. ## Результаты В результате исследований, описанных в статье, авторы показали, что использование мер неотличимости позволяет получить более точную оценку качества прогноза, чем использование классических мер качества. Также было показано, что меры неотличимости могут быть применены для проверки качества различных моделей прогнозирования. Эксперименты проводились на разных наборах данных, и в них были исследованы различные модели прогнозирования. Авторы показали, что применение мер неотличимости позволяет улучшить точность прогноза в несколько раз в сравнении с классическими методами. ## Значимость Предлагаемый подход имеет широкое применение в области машинного обучения и других областях, где используются прогнозирования. Он позволяет улучшить качество прогнозирования, особенно в ситуациях, когда используется несколько моделей прогнозирования. Одним из основных преимуществ этого подхода является возможность оценивать качество прогнозов не только с помощью классических мер качества, но и с помощью мер неотличимости, что позволяет получить более пол

Annotation:

Calibration is a classical notion from the forecasting literature which aims to address the question: how should predicted probabilities be interpreted? In a world where we only get to observe (discrete) outcomes, how should we evaluate a predictor that hypothesizes (continuous) probabilities over possible outcomes? The study of calibration has seen a surge of recent interest, given the ubiquity of probabilistic predictions in machine learning. This survey describes recent work on the foundation...

ID: 2509.02279v1 cs.LG, cs.GT, stat.ML

arXiv PDF

📄 Gaming and Cooperation in Federated Learning: What Can Happen and How to Monitor It

2025-09-06

Авторы:

Dongseok Kim, Wonjun Jeong, Gisung Oh

## Контекст Federated Learning (FL) является важной методологией в области машинного обучения, позволяющей обучать модели на распределенных данных, обеспечивая при этом приватность данных участников. Однако, успех FL часто зависит от поведения участников, которое может быть непредсказуемым и целенаправленным. Участники могут искажать результаты обучения, например, в ущерб общей модели, чтобы оптимизировать метрики, которые оценивают их вклад. Такое поведение, известное как "gaming" (игра), может привести к снижению качества модели и ухудшению ее работы в реальной среде. Необходима система мониторинга, которая позволит определять и интерпретировать подобные попытки игры, чтобы предотвратить их и сохранить доверие в системе. ## Метод Мы развиваем аналитический фреймворк, который рассматривает FL не только как задачу оптимизации, но и как стратегическую систему с правилами и инстинктами. Мы предлагаем два индекса: **Incentive Index (Индекс стимулов)**, оценивающий степень целесообразности поддельных действий, и **Performance Loss Index (Индекс потерь производительности)**, измеряющий фактический вклад в общую производительность. Эти индексы позволяют оценивать поведение участников в различных условиях. Мы также разрабатываем алгоритм для распределения ресурсов аудита, чтобы эффективно отслеживать и обнаруживать подозрительные участников. Далее, мы формулируем ранние сигналы о подозрительном поведении, которые могут быть использованы для активной мониторинга. ## Результаты Мы проводим эксперименты на различных симуляционных средах, включая те, где участники играют на коллективную потерю, и другие, где индивидуальные игры преимущественно стимулируются. Наши результаты показывают, что индексы могут точно выявлять игровые попытки в различных условиях. Мы также проверяем эффективность алгоритма распределения ресурсов аудита, который позволяет оптимизировать ресурсы для мониторинга. Кроме того, мы определяем пороговые значения, автоматические правила переключения, и ранние сигналы, которые могут быть использованы для простого интегрирования в реальные ситуации. ## Значимость Наши находки могут быть применены в различных сферах, включая распределенные системы, игровые сценарии, и даже корпоративные среды, где участники могут искажать результаты для выгоды. Мы показываем, что наш подход позволяет повысить доверие к FL, уменьшить стимулы для метрической игры, и обеспечить консистентную производительность. Мы также подчеркиваем, что целесообразность наших рекомендаций зависит от того, насколько участники могут быть способны оценить каждую ситуацию и принять

Annotation:

The success of Federated Learning depends on the actions that participants take out of sight. We model Federated Learning not as a mere optimization task but as a strategic system entangled with rules and incentives. From this perspective, we present an analytical framework that makes it possible to clearly identify where behaviors that genuinely improve performance diverge from those that merely target metrics. We introduce two indices that respectively quantify behavioral incentives and collec...

ID: 2509.02391v1 cs.LG, cs.GT, stat.ML

arXiv PDF