Trustworthy scientific inference for inverse problems with generative models

2508.02602v1 stat.ML, astro-ph.IM, cs.LG, stat.AP, stat.ME 2025-08-09
Авторы:

James Carzon, Luca Masserano, Joshua D. Ingram, Alex Shen, Antonio Carlos Herling Ribeiro Junior, Tommaso Dorigo, Michele Doro, Joshua S. Speagle, Rafael Izbicki, Ann B. Lee

Резюме на русском

## Контекст Генеративные искусственные нейронные сети, такие как генеративные модели типа GAN и VAEs, показали необычайную эффективность в генерировании сложных структур данных, таких как изображения, текст и видео, основываясь на обучении с подкреплением. За последние несколько лет, эти модели были применены в различных научных областях для выполнения инверсионных задач, которые заключаются в интерпретации входных данных для вывода потенциально необратимых параметров, таких как взаимодействия частиц в физике или распределения тел в космологии. Однако существуют значительные ограничения в их использовании. Традиционные методы могут приводить к вариациям в результатах или создают недостаточно обоснованные выводы, особенно при отсутствии доступа к полной вероятностной модели. В этой работе мы предлагаем метод, который расширяет генеративные модели за пределы обычных областей использования и позволяет выполнять надежные выводы в условиях, когда полнота информации о некоторых параметрах недоступна. ## Метод Мы предлагаем **FreB** (Frequentist-Bayes), который является системой для гарантии надежности в выводе в области инверсионных задач. Метод комбинирует теории Фрегеля и Байеса, чтобы преобразовать генеративные модели в методы, которые позволяют формировать более точные интервалы для параметров. FreB работает следующим образом: он принимает входные данные и генеративную модель, а затем формирует множество возможных интерпретаций параметров, которые лучше всего соответствуют наблюдаемым данным. Это множество формируется с использованием оператора наименьшего квадрата и теоремы Байеса. На выходе получается интервал, который содержит реальные параметры в процентном соотношении, соответствующем заданной доверительной границе. Мы также предоставляем диагностические инструменты, которые позволяют отслеживать качество решения и понять, насколько модель доверенна. ## Результаты Мы провели эксперименты в нескольких научных областях, включая физику, астрономию и геологию. Наши эксперименты включали: 1. **Определение неизвестных источников данных**: мы использовали FreB для идентификации источников данных в случаях, когда данные поступали из нескольких источников, но не было наличия значительных описательных данных. 2. **Реконструкция теоретических моделей**: мы использовали FreB для разрешения конфликтов между различными теоретическими моделями, которые объясняли одни и те же наблюдения. 3. **Сокращение систематических ошибок в обсервациях**: мы применили FreB для коррекции систематических ошибок в данных, например, в случае неточного измерения времени в физи

Abstract

Generative artificial intelligence (AI) excels at producing complex data structures (text, images, videos) by learning patterns from training examples. Across scientific disciplines, researchers are now applying generative models to ``inverse problems'' to infer hidden parameters from observed data. While these methods can handle intractable models and large-scale studies, they can also produce biased or overconfident conclusions. We present a solution with Frequentist-Bayes (FreB), a mathematically rigorous protocol that reshapes AI-generated probability distributions into confidence regions that consistently include true parameters with the expected probability, while achieving minimum size when training and target data align. We demonstrate FreB's effectiveness by tackling diverse case studies in the physical sciences: identifying unknown sources under dataset shift, reconciling competing theoretical models, and mitigating selection bias and systematics in observational studies. By providing validity guarantees with interpretable diagnostics, FreB enables trustworthy scientific inference across fields where direct likelihood evaluation remains impossible or prohibitively expensive.

Ссылки и действия