Calibration through the Lens of Indistinguishability

2509.02279v1 cs.LG, cs.GT, stat.ML 2025-09-06

Авторы:

Parikshit Gopalan, Lunjia Hu

Резюме на русском

## Контекст Рассмотрение проблемы calibration в статье "Calibration through the Lens of Indistinguishability" возникает в контексте традиционного сообщества по прогнозированию, которое рассматривает вопросы, связанные с интерпретацией прогнозируемых вероятностей. В неизбежной неопределенности мира, где прогнозы представляются в виде вероятностей, а реальные результаты происходят в виде дискретных выборов, возникает вопрос о том, как должны быть оценены прогнозы вероятностей. Эта проблема становится все актуальнее в связи с появлением в машинном обучении и других областях искусственного интеллекта вероятностных прогнозов. В статье авторы рассматривают альтернативный взгляд на моделирование и оценку прогнозирования под названием "indistinguishability" (неотличимость), которая позволяет понимать как процесс прогнозирования, так и меры качества прогнозов в целом. ## Метод Подход, изложенный в статье, основывается на идее неотличимости мира, прогнозируемого моделью, и реального мира. Качество прогноза оценивается на основе способности отличить данные, полученные от прогнозирующей модели, от реальных данных, полученных от "оптимального" прогнозирующего модели. Для этого авторы предлагают вводить различные меры неотличимости, которые позволяют измерить разницу между этими двумя мирами. Основная идея заключается в том, что если модель прогнозирует неверную вероятность, то она становится неотличимой от истинного мира. Альтернативный подход, предложенный в статье, заключается в использовании методов, позволяющих оценить качество прогноза, не только с помощью мер качества (как precision и recall), но и с помощью мер неотличимости. ## Результаты В результате исследований, описанных в статье, авторы показали, что использование мер неотличимости позволяет получить более точную оценку качества прогноза, чем использование классических мер качества. Также было показано, что меры неотличимости могут быть применены для проверки качества различных моделей прогнозирования. Эксперименты проводились на разных наборах данных, и в них были исследованы различные модели прогнозирования. Авторы показали, что применение мер неотличимости позволяет улучшить точность прогноза в несколько раз в сравнении с классическими методами. ## Значимость Предлагаемый подход имеет широкое применение в области машинного обучения и других областях, где используются прогнозирования. Он позволяет улучшить качество прогнозирования, особенно в ситуациях, когда используется несколько моделей прогнозирования. Одним из основных преимуществ этого подхода является возможность оценивать качество прогнозов не только с помощью классических мер качества, но и с помощью мер неотличимости, что позволяет получить более пол

Abstract

Calibration is a classical notion from the forecasting literature which aims to address the question: how should predicted probabilities be interpreted? In a world where we only get to observe (discrete) outcomes, how should we evaluate a predictor that hypothesizes (continuous) probabilities over possible outcomes? The study of calibration has seen a surge of recent interest, given the ubiquity of probabilistic predictions in machine learning. This survey describes recent work on the foundational questions of how to define and measure calibration error, and what these measures mean for downstream decision makers who wish to use the predictions to make decisions. A unifying viewpoint that emerges is that of calibration as a form of indistinguishability, between the world hypothesized by the predictor and the real world (governed by nature or the Bayes optimal predictor). In this view, various calibration measures quantify the extent to which the two worlds can be told apart by certain classes of distinguishers or statistical measures.

Ссылки и действия

Читать на arXiv Скачать PDF

Дополнительные ресурсы:

Calibration through the Lens of Indistinguishability

Авторы:

Резюме на русском

Abstract

Ссылки и действия

Связанные статьи

Solving Neural Min-Max Games: The Role of Architecture, Initialization & Dynamic...

Look-Ahead Reasoning on Learning Platforms

Data Reliability Scoring

Tight Regret Upper and Lower Bounds for Optimistic Hedge in Two-Player Zero-Sum ...

Gaming and Cooperation in Federated Learning: What Can Happen and How to Monitor...

Навигация