Seeing the Many: Exploring Parameter Distributions Conditioned on Features in Surrogates

2508.13088v1 cs.LG, cs.HC 2025-08-20
Авторы:

Xiaohan Wang, Zhimin Li, Joshua A. Levine, Matthew Berger

Резюме на русском

#### Контекст В последние годы neural surrogate models стали выделяться как более подходящая альтернатива традиционным симуляционным процессам в научных исследованиях. Эти модели эффективно моделируют функционал симуляционных процессов, устраняя необходимость запуска дорогостоящих симуляций. В дополнение к моделированию простых функций входных и выходных параметров, суррогатные модели также показали свою полезность в решении инверских задач. Инверсионные задачи могут быть определены как поисковые, где целью является найти параметры, генерирующие заданный выход с указанной особенностью. Однако, нахождение таких параметров в высокомишченодименсиональных пространствах может оказаться дорогостоящим, поскольку поиск может требовать много запусков симуляций. На данный момент, большинство суррогатных решений ограничиваются только поиском небольшого набора параметров, которые удовлетворяют заданному критерию, но не охватывают широкий круг возможных вариантов. Мы адресуем эту проблему, стремясь моделировать и визуализировать распределение возможных входных параметров, которые приводят к заданной особенности вывода. #### Метод Мы разработали метод, который моделирует распределение входных параметров с помощью density estimation. Наша модель доверительного распределения основывается на близости новых параметров к тем, которые были использованы в обучении модели, как в пространстве входных параметров, так и в пространстве выходных функций. Мы используем эту модель для формирования предварительных убеждений о возможных параметрах, что позволяет эффективно оптимизировать поиск. В комбинации с likelihood-распределением по фичам, это позволяет генерировать эффективные итоговые параметры, которые соответствуют заданной выходной функции. Мы реализовали данную модель внутри интерактивного инструмента, который позволяет проводить интерактивный анализ входных параметров с целью поиска и визуализации тех, которые могут привести к заданной особенности вывода. #### Результаты Мы проверили нашу модель на трех наборах данных, каждый из которых представляет собой различный набор симуляционных моделей. Мы проводили эксперименты, используя широкую область входных параметров для каждой модели. Наше решение позволило эффективно моделировать распределение возможных параметров, которые могут привести к заданному выходу. Мы также продемонстрировали возможность нашего инструмента для проведения интерактивного анализа параметров, что позволяет пользователю быстро и эффективно идентифицировать значимые параметры с помощью визуальных инструментов. #### Значимость Наше решение может быть применено в различных областях

Abstract

Recently, neural surrogate models have emerged as a compelling alternative to traditional simulation workflows. This is accomplished by modeling the underlying function of scientific simulations, removing the need to run expensive simulations. Beyond just mapping from input parameter to output, surrogates have also been shown useful for inverse problems: output to input parameters. Inverse problems can be understood as search, where we aim to find parameters whose surrogate outputs contain a specified feature. Yet finding these parameters can be costly, especially for high-dimensional parameter spaces. Thus, existing surrogate-based solutions primarily focus on finding a small set of matching parameters, in the process overlooking the broader picture of plausible parameters. Our work aims to model and visualize the distribution of possible input parameters that produce a given output feature. To achieve this goal, we aim to address two challenges: (1) the approximation error inherent in the surrogate model and (2) forming the parameter distribution in an interactive manner. We model error via density estimation, reporting high density only if a given parameter configuration is close to training parameters, measured both over the input and output space. Our density estimate is used to form a prior belief on parameters, and when combined with a likelihood on features, gives us an efficient way to sample plausible parameter configurations that generate a target output feature. We demonstrate the usability of our solution through a visualization interface by performing feature-driven parameter analysis over the input parameter space of three simulation datasets. Source code is available at https://github.com/matthewberger/seeing-the-many

Ссылки и действия