System-Level Uncertainty Quantification with Multiple Machine Learning Models: A Theoretical Framework

2509.16663v1 stat.ML, cs.LG 2025-09-24
Авторы:

Xiaoping Du

Резюме на русском

#### Контекст Модели машинного обучения (МЛ) часто неточны при прогнозировании, и эти ошибки могут быть квантифицированы с помощью моделирования неопределенности модели. Если несколько МЛ-моделей обучаются на одних и тех же данных, их моделирование неопределенности может быть статистически зависимым. Фактически, входные данные моделей также неопределенны случайным образом. Таким образом, для точного принятия решений и проектирования необходимо учитывать эти виды неопределенности. Цель данной работы — разработать теоретическую модель, которая будет формировать совокупное распределение прогнозов нескольких МЛ-моделей, исходя из статистического распределения моделирования неопределенности моделей и входных данных. #### Метод Для построения теоретической модели используется методика декомпозиции неопределенности. Для этого МЛ-модели представляются как суммарные эффекты независимых неопределенных входных данных и неопределенности моделей. Основное предположение заключается в том, что моделирование неопределенности моделей и входных данных происходит независимо. Для генерации совокупного распределения неопределенности нескольких МЛ-моделей разработана модель, которая преобразует зависимости в независимость с помощью статистических методов. Это позволяет оценивать границы неопределенности, учитывая все виды неопределенности. #### Результаты Используя модель, проведены численные эксперименты на данных, полученных в реальных условиях. Модель была применена для оценки неопределенности прогнозных моделей в различных сценариях решения задач. На основе экспериментов были получены статистические выводы о влиянии различных типов неопределенности на прогностическую точность моделей. Также были проанализированы сценарии применения модели к решению задач, требующих учета неопределенности. #### Значимость Разработанная модель может быть применена в различных областях, где неопределенность играет ключевую роль: биологии, финансах, промышленности и других. Основное преимущество этого подхода заключается в том, что он учитывает несколько типов неопределенности, что дает более точные прогнозы. Это может привести к значительным улучшениям в принятии решений и проектировании систем. Будущие исследования могут быть направлены на развитие практических алгоритмов для реализации этой модели в различных сферах. #### Выводы Разработанная теоретическая модель представляет собой мощный инструмент для квантификации неопределенности нескольких МЛ-моделей. Она позволяет учитывать независимость входных данных и моделирования неопределенности, чтобы получать более точные прогнозы. Это открывает широкие воз

Abstract

ML models have errors when used for predictions. The errors are unknown but can be quantified by model uncertainty. When multiple ML models are trained using the same training points, their model uncertainties may be statistically dependent. In reality, model inputs are also random with input uncertainty. The effects of these types of uncertainty must be considered in decision-making and design. This study develops a theoretical framework that generates the joint distribution of multiple ML predictions given the joint distribution of model uncertainties and the joint distribution of model inputs. The strategy is to decouple the coupling between the two types of uncertainty and transform them as independent random variables. The framework lays a foundation for numerical algorithm development for various specific applications.

Ссылки и действия