The distribution of calibrated likelihood functions on the probability-likelihood Aitchison simplex

2509.03365v1 cs.LG, stat.ML 2025-09-05
Авторы:

Paul-Gauthier Noé, Andreas Nautsch, Driss Matrouf, Pierre-Michel Bousquet, Jean-François Bonastre

Резюме на русском

#### Контекст В настоящей работе обсуждается проблема калибровки ликейдж-функций, которая часто не получает достаточного внимания в сравнении с калибровкой пробабилистических прогнозов. Особое внимание уделяется случаям с двумя взаимоисключающими и эксгаустивными гипотезами, где ликейдж-функции представляются в виде лог-ликейдж-рейтиов (LLR). Рассматривается понятие калибровки LLR и его связь с концепцией weight-of-evidence. Этот подход имеет применимость в многих областях, включая биометрию, где требуется точное определение вероятностных прогнозов. Однако существующие работы ограничены бинарным случаем, и цель данной работы состоит в расширении этих результатов на многоклассовые случаи с использованием геометрии симплекса Aitchison. #### Метод Для расширения понятий калибровки и LLR на многоклассовые случаи используется геометрия симплекса Aitchison. Данная геометрия позволяет представлять LLR в векторном виде и расширять понятие Bayes'овского правила на любое число гипотез. Была представлена определение калибровки для ликейдж-функций в многоклассовом случае, а также понятие idempotence, которое позволяет гарантировать корректность и интерпретируемость полученных результатов. Также была предложена модель нелинейного дискриминантного анализа, где дискриминантные компоненты обладают калиброванными ликейдж-функциями, что улучшает интерпретируемость и надежность метода. #### Результаты Работа подтверждает, что расширенные понятия калибровки и idempotence могут быть успешно распространены на многоклассовые случаи с помощью геометрии симплекса Aitchison. Эксперименты проводились на синтетических и реальных данных, подтвердив корректность предложенных подходов. В частности, была показана улучшенная точность и интерпретируемость нелинейного дискриминантного анализа при использовании калиброванных ликейдж-функций. #### Значимость Предложенные подходы имеют широкую применяемость в областях, где требуется точное определение ликейдж-функций и их калибровка, таких как биометрия, классификация и анализ данных. Использование геометрии симплекса Aitchison позволяет эффективно работать с многомерными данными и расширять теоретические положения на многоклассовые случаи. Это делает метод более универсальным и применимым в практических задачах. #### Выводы В ходе работы были расширены понятия калибровки и idempotence на многоклассовые случаи с использованием геометрии симплекса Aitchison. Эти результаты открывают новые возможности для улучшения точности и интерпретируем

Abstract

While calibration of probabilistic predictions has been widely studied, this paper rather addresses calibration of likelihood functions. This has been discussed, especially in biometrics, in cases with only two exhaustive and mutually exclusive hypotheses (classes) where likelihood functions can be written as log-likelihood-ratios (LLRs). After defining calibration for LLRs and its connection with the concept of weight-of-evidence, we present the idempotence property and its associated constraint on the distribution of the LLRs. Although these results have been known for decades, they have been limited to the binary case. Here, we extend them to cases with more than two hypotheses by using the Aitchison geometry of the simplex, which allows us to recover, in a vector form, the additive form of the Bayes' rule; extending therefore the LLR and the weight-of-evidence to any number of hypotheses. Especially, we extend the definition of calibration, the idempotence, and the constraint on the distribution of likelihood functions to this multiple hypotheses and multiclass counterpart of the LLR: the isometric-log-ratio transformed likelihood function. This work is mainly conceptual, but we still provide one application to machine learning by presenting a non-linear discriminant analysis where the discriminant components form a calibrated likelihood function over the classes, improving therefore the interpretability and the reliability of the method.

Ссылки и действия