The distribution of calibrated likelihood functions on the probability-likelihood Aitchison simplex
2509.03365v1
cs.LG, stat.ML
2025-09-05
Авторы:
Paul-Gauthier Noé, Andreas Nautsch, Driss Matrouf, Pierre-Michel Bousquet, Jean-François Bonastre
Резюме на русском
#### Контекст
В настоящей работе обсуждается проблема калибровки ликейдж-функций, которая часто не получает достаточного внимания в сравнении с калибровкой пробабилистических прогнозов. Особое внимание уделяется случаям с двумя взаимоисключающими и эксгаустивными гипотезами, где ликейдж-функции представляются в виде лог-ликейдж-рейтиов (LLR). Рассматривается понятие калибровки LLR и его связь с концепцией weight-of-evidence. Этот подход имеет применимость в многих областях, включая биометрию, где требуется точное определение вероятностных прогнозов. Однако существующие работы ограничены бинарным случаем, и цель данной работы состоит в расширении этих результатов на многоклассовые случаи с использованием геометрии симплекса Aitchison.
#### Метод
Для расширения понятий калибровки и LLR на многоклассовые случаи используется геометрия симплекса Aitchison. Данная геометрия позволяет представлять LLR в векторном виде и расширять понятие Bayes'овского правила на любое число гипотез. Была представлена определение калибровки для ликейдж-функций в многоклассовом случае, а также понятие idempotence, которое позволяет гарантировать корректность и интерпретируемость полученных результатов. Также была предложена модель нелинейного дискриминантного анализа, где дискриминантные компоненты обладают калиброванными ликейдж-функциями, что улучшает интерпретируемость и надежность метода.
#### Результаты
Работа подтверждает, что расширенные понятия калибровки и idempotence могут быть успешно распространены на многоклассовые случаи с помощью геометрии симплекса Aitchison. Эксперименты проводились на синтетических и реальных данных, подтвердив корректность предложенных подходов. В частности, была показана улучшенная точность и интерпретируемость нелинейного дискриминантного анализа при использовании калиброванных ликейдж-функций.
#### Значимость
Предложенные подходы имеют широкую применяемость в областях, где требуется точное определение ликейдж-функций и их калибровка, таких как биометрия, классификация и анализ данных. Использование геометрии симплекса Aitchison позволяет эффективно работать с многомерными данными и расширять теоретические положения на многоклассовые случаи. Это делает метод более универсальным и применимым в практических задачах.
#### Выводы
В ходе работы были расширены понятия калибровки и idempotence на многоклассовые случаи с использованием геометрии симплекса Aitchison. Эти результаты открывают новые возможности для улучшения точности и интерпретируем
Abstract
While calibration of probabilistic predictions has been widely studied, this
paper rather addresses calibration of likelihood functions. This has been
discussed, especially in biometrics, in cases with only two exhaustive and
mutually exclusive hypotheses (classes) where likelihood functions can be
written as log-likelihood-ratios (LLRs). After defining calibration for LLRs
and its connection with the concept of weight-of-evidence, we present the
idempotence property and its associated constraint on the distribution of the
LLRs. Although these results have been known for decades, they have been
limited to the binary case. Here, we extend them to cases with more than two
hypotheses by using the Aitchison geometry of the simplex, which allows us to
recover, in a vector form, the additive form of the Bayes' rule; extending
therefore the LLR and the weight-of-evidence to any number of hypotheses.
Especially, we extend the definition of calibration, the idempotence, and the
constraint on the distribution of likelihood functions to this multiple
hypotheses and multiclass counterpart of the LLR: the isometric-log-ratio
transformed likelihood function. This work is mainly conceptual, but we still
provide one application to machine learning by presenting a non-linear
discriminant analysis where the discriminant components form a calibrated
likelihood function over the classes, improving therefore the interpretability
and the reliability of the method.
Ссылки и действия
Дополнительные ресурсы: